


Enterprise Content Management: 
Theory and Practice 


Wan 





企业 内 容 管 理 理论 与 实践 


歼 永 时 王 晓 庆 著 


9 


机 械 工 业 出 版 社 





本 书 全 面 介绍 了 企业 内 容 管理 的 各 种 知识 ， 透 彻 地 阐释 了 企业 内 容 管 
理 的 基本 概念 。 本 书 内 容 丰 富 ， 不 仅 讨 论 了 企业 内 容 管理 的 概念 、 构 建 型 
论 模型 、 互 操作 性 、 体 系 结构 和 各 种 实例 ， 而 且 全 面 分 析 了 企业 对 于 内 容 
管理 的 需求 。 本 书 从 理论 到 实践 ， 读 者 通过 本 书 可 以 了 解 企业 内 容 管理 的 
理论 及 关键 技术 ， 提 高 企业 内 容 管理 应 用 开发 的 水 平 。 

本 书 是 一 本 系统 介绍 企业 内 容 管理 理论 与 实践 的 专著 ， 既 可 以 作为 信 
管理 、 信 息 工程 、 内 容 管 理 等 相关 专业 高 年 级 本 科 生 和 研究 生 的 企业 内 
管理 课程 教材 ， 也 可 为 从 事 企 业内 容 管理 、 知 识 管 理 、 文 档 管 理 、 电 子 
案 管 理 、 影 像 文 件 管理 等 相关 领域 的 专家 、 学 者 和 研究 人 员 提 供 参 考 。 
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近年 来 ， 随 着 开 应 用 的 深入 普及 ， 各 行 各 业 都 积累 了 大 量 的 信息 
科学 管理 和 合理 开发 这 些 内 部 和 外 部 信息 资源 已 经 成 为 企业 正确 决策 、 增 强 























竞争 力 的 关键 。 最 近 A. T. Kearney 公司 的 一 项 研究 指出 ， 
力 的 数字 内 容 每 年 会 花费 公司 7500 亿美 元 ， 

















“缺乏 有 效 发 布 能 


资源 。 














找 和 获取 完成 他 们 的 工作 所 需要 的 信息 上 ”。 在 一 些 诸如 电信 、 人 金融 、 
等 以 内 容 为 其 核心 业务 的 行业 中 ， 内 容 和 应 用 程序 代码 已 成 为 关键 性 资产 。 




















数据 管理 的 需求 已 经 超出 了 传统 数据 管理 的 概念 。 
研究 部 门 调查 发 现 ， 在 企业 存储 的 大 量 数 据 中 ， 传 统 关系 数据 库 管理 系 
统 处 理 的 结构 化 数据 仅 占 数据 信息 总 量 的 159 ， 而 全 球 85% 的 信息 是 








化 的 ,包括 纸 上 的 文件 、 报 告 、 


如 何 管理 这 些 非 结构 化 的 信息 ， 
































视频 和 音频 文件 、 照 片 、 传 真 件 、 信 
成 为 传统 结构 化 数据 管理 的 一 大 难题 。 











是 目前 企业 软件 中 发 展 最 快 的 类 别 。 随 着 国内 IT 管理 水 平 的 迅速 提升 ， 





企业 对 于 企业 内 容 管理 的 需求 也 日 益 强 烈 。 但 由 于 产品 技术 门槛 高 ， 以 及 理 
论 知识 欠缺 ， 所 以 目前 国内 相关 的 专业 软件 公司 非常 少 ， 也 没有 相应 的 成 熟 














产品 ， 而 采购 国外 的 产品 价格 本 





目 当 昂贵 ， 也 不 太 适 合 国内 企业 的 环境 。 





因为 知识 型 雇员 将 时 间 浪 到 








在 导 
媒体 


因此 ， 要 增强 自身 的 全 球 竞争 力 ， 企 业 就 必须 将 内 容 转 化 为 推动 商业 成 功 的 


资产 。 与 此 同时 ， 所 有 行业 也 都 面临 着 管理 各 种 格式 的 信息 的 挑战 。 客 户 对 





E 结 构 
件 等 。 


企业 内 容 管 理 (Enterprise Content Management，ECM) 关注 于 企业 内 部 
以 及 企业 之 间 的 文本 和 多 媒体 内 容 的 管理 
理 技术 ， 伴 随 着 非 结 构 化 数据 规模 和 应 用 需求 的 不 断 增 长 ， 逐 渐 成 为 数据 管 
理 技 术 发 展 的 一 个 重要 方向 ， 是 近年 来 一 个 新 兴 的 信息 管理 


EE ， 作 为 一 种 专门 的 非 结 构 化 信息 管 


E 学 研究 领域 ， 也 


国内 





本 书 的 目标 就 是 希望 通过 对 ECM 理论 和 构建 技术 的 介绍 ， 来 填补 这 一 国 
内 市 场 空 白 ， 从 而 使 国内 众多 用 户 了 人 解 企 业内 容 管理 理论 ， 将 自身 需求 提升 








到 理论 层面 ， 有 助 于 降低 成 本 ， 
国 的 政府 机 构 / 企 业 大 大 提升 内 
核心 竞争 力 。 


本 书 共 分 10 章 。 第 1 章 介 


























设计 、 构 建 开 发 性 和 扩展 性 好 的 产品 ， 











使 中 


容 管理 水 平 以 及 信息 利用 水 平 ， 提 升 自 己 的 








绍 了 内 容 和 内 容 管理 的 概念 ， 包 括 数据 、 








和 和 内容; 内 容 到 底 是 什么 ; 内 容 管理 ， 内 容 管 理 的 关键 技术 ， 内 容 管 到 
用 领域 等 。 第 2 章 介绍 了 企业 内 容 管 理 系统 的 组 成 以 及 发 展 历史 和 趋势 ， 企 











风 
言 息 


的 应 





“IV ， 企业 内 容 管理 理论 与 实践 





业内 容 管 理 技 术 的 研究 领域 ， 企 业内 容 管 理 和 知识 管理 的 联系 与 区 别 。 第 3 





章 介 绍 了 内 容 仓库 模型 概念 和 

















目前 ECM 领域 的 内 容 仓 库 规范 ， 通 过 对 








JCR1.0 和 2. 0 标准 的 详细 分 析 ， 使 读者 了 解 到 内 容 仓 库 标准 化 的 好 处 ， 理 解 
仓库 模型 的 组 成 构建 原理 ,熟悉 仓库 不 同 级 别 的 关系 、 功 能 ， 以 及 具体 实现 

















过 程 。 第 4 章 介 绍 了 内 容 管理 互 1 

















操作 性 服务 ( Content Management Interopera- 











pility Services，CMIS) ，CMIS 是 一 个 规范 ， 旨 在 定义 一 个 标准 化 的 方法 访问 


内 容 库 ， 独 立 于 供应 商 、 平 台 和 乡 








套 基于 REST 架构 的 Web 服务 ， 包 括 Web 服务 (Web Services) 和 表述 性 状 
态 转移 (Representational State Transfer，REST) 风格 的 AtomPub 包 ， 应 用 程 


< 














启程 语言 ; CMIS 标准 定义 可 一 个 域 模型 和 一 

















序 可 以 使 用 CMIS 与 一 个 或 多 个 内 容 管 理 库 /系统 交互 。 第 5 章 介绍 了 企业 内 
容 管 理 的 实现 技术 : Web 服务 和 REST，Web 服务 是 一 种 以 SOAP 为 轻 量 型 传 








过 




















输 协 议 、 以 XML 为 数据 封装 标准 





基于 HTTP 的 组 件 集 成 技术 ; 使 用 SOAP 








输 方式 ， 使 XML 作为 数据 封包 的 





式 的 Web 服务 与 复杂 的 SOAP 和 

















HH 





理 系 统 的 体系 结构 原理 相关 知识 。 
式 ，ECM 系统 是 典型 的 软件 系统 
种 : 单 服务 集中 式 系统 、 两 层 / 多 








生 为 组 件 间 的 调用 协议 ,使 用 HTTP 页 面 作为 客户 端 与 服务 器 之 间 的 数据 传 


牛 服务 的 卓越 性 能 。 目 前 在 三 种 主流 的 Web 服务 实现 方案 中 ， 因 为 REST 模 








标准 。 因 而 它 具有 跨 平 台 调 用 和 无 终 集 成 组 





























XML-RPC 对 比 来 讲 明 显 地 更 加 简洁 ， 越 来 





越 多 的 Web 服务 开始 采用 REST 风格 设计 和 实现 。 第 6 章 介 绍 了 企业 内 容 管 





第 7 章 介绍 了 企业 内 容 管理 系统 的 部 署 模 
结构 ， 它 所 涉及 的 部 署 模式 也 包括 下 列 几 
层 、 三 层 B/S 结构 、 分 布 式 系统 等 。 第 8 ~ 





10 章 ， 分 别 介绍 了 ECM 的 儿 种 实践 ， 包 括 IBM 公司 的 FileNet P8 、 微 软 公司 
的 SharePoint、Alfresco 公司 的 产品 等 。 
本 书 是 国内 第 一 本 全 面 介绍 企业 内 容 管理 理论 和 技术 的 书籍 ， 内 容 包 括 








理论 、 关 键 技 术 和 实践 三 大 部 分 。 























助 ， 在 此 一 并 表示 衷心 的 感谢 。 


本 书 是 一 本 系统 介绍 企业 内 容 管理 
容 涉及 内 容 和 内 容 管理 、 企 业内 容 管理 和 知识 管理 、 企 业内 容 管 理 系统 、 内 
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容 仓 库 的 标准 化 规范 、 内 容 管理 
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本 书 结构 上 注重 理论 和 实践 的 结合 ， 同 时 


兼顾 新 技术 方面 的 内 容 。 形 式 上 以 章 、 节 为 单元 。 对 比 DBMS 软件 产业 ， 可 
以 预见 ECMS 也 是 一 个 巨大 的 软件 产业 。 
本 书 的 作者 是 奢 永 星 和 王 晓 庆 。 其 中 奢 永 星 承 担 第 1 ~5 章 的 写作 ， 王 晓 
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帮 日 


























里 理论 、 知 识 、 标 准 和 实践 的 专著 ， 内 























操作 性 服务 规范 、Web 服务 与 REST、 企 


业内 容 管 理 系统 的 体系 结构 、 企 业内 容 管理 的 部 署 、FileNet P8、 微 软 Share- 





前 言 .VV. 








Point、Alfresco 等 。 本 书 的 出 版 将 为 国内 众多 企业 管理 者 、 信 息 化 规划 者 、 
信息 化 构建 者 以 及 软件 开发 架构 师 、 设 计 人 员 、 开 发 人 员 ， 提 供 借 鉴 和 人 参考。 

本 书 是 作者 多 年 科研 工作 的 结晶 ， 非 常 感谢 北京 工商 大 学 领导 的 大 力 支 
en” 
创新 平台 (PXM2011-014213-113551) 的 资助 ， 在 此 一 并 表示 更 心 的 感谢 。 

在 本 书 的 编写 过 程 中 ， pe pe 委 料 ， 在 此 谨 向 诸多 学 者 
表示 衷心 的 感谢 。 由 于 作者 水 平 有 限 ， 虽 对 本 书 进行 了 反复 的 审核 ， 书 中 错 
误 与 缺点 在 所 难免 ， 和 希望 读者 给 予 批评 指正 ， 多 提 宝 贵 意见 



















































































作者 
2012 年 6 月 





































































































前 言 
第 1 萤 内 容 和 内 容 管理 和 和 ee 全 1 
1.1 数据 、 人 本 1 
1.1.1 什么 是 数据 1 
1. 1.2 信息 的 理解 和 Ne 2 
1.1.3 内容 的 理解 5 
1.2 内容 到 底 是 什么 6 
1.2.1 内 容 不 是 数据 6 
到: 人 内 容 是 信息 的 使 用 9 
1.2.3 内 容 是 信息 二 数据 10 
1.3 内 容 管理 pe 10 
1.3.1 内 容 管理 基本 概念 10 
1.3.2 内容 管理 的 重要 性 11 
1.3.3 内 容 管理 的 建设 方法 12 
1.3.4 内 容 管理 的 发 展 趋势 13 
1.4 内容 管理 的 关键 技术 14 
1.4.1 XML 和 元 数据 14 
1.4.2 内 容 仓 库 技 术 15 
1.4.3 内 容 访 问 技术 ee peo ee De eT A 15 
1.4.4 ”工作 流 技术 ee 16 
1.4.5 应 用 集成 技术 17 
1.4.6 ”数据 检索 和 挖掘 技术 17 
1.5 内 容 管理 的 应 用 18 
1.5.1 网 站 内 容 管理 18 
1.5.2 媒体 内 容 管理 PN 18 
1.5.3 企业 内 容 管理 19 
1.5.4 金融 业 内 容 管理 i Rie oh i Sd nd nd a ere oa edd ora edd ro 19 
1.5.5 电子 政务 中 的 内 容 管 理 PN 19 
1.5.6 保险 行业 中 的 j 容 管理 DA a a 20 
1.6 J ns 20 
第 2 党 ”在 业 内容 管理 ope  N 22 
2.1 企业 内 容 管理 ee SD To 22 








2.1.1 企 ， 业内 容 管 理 的 定义 Pepe Oo EE Ee OPT RR Re A 22 










































































2.1.2 企业 内 容 管理 的 功能 组 件 23 
2.1.3 企业 内 容 管理 的 内 泣 24 
2.1.4 企业 内 容 管理 的 效益 24 
2.2 企业 内 容 管理 的 发 展 历史 和 趋势 25 
2.2.1 企业 内 容 管理 的 发 展 历 中 25 
2.2.2 企业 内 容 管理 的 发 展 趋势 pp 26 
2.3 企业 内 容 管理 系统 26 
2.3.1 企业 内 容 管理 系统 的 体系 结构 26 
2.3.2 企业 内 容 管理 系统 的 功能 28 
2.3.3 企业 内 容 管理 系统 的 组 成 pp 29 
2.4 知识 管理 pp 29 
2.4.1 知识 的 定义 29 
2.4.2 知识 管理 pp 30 
2.5 企业 内 容 管理 和 知识 管理 pp 31 
2.5.1 两 者 的 区 别 pp 32 
DS 2 联系 之 处 9 32 
第 3 章 内 容 仓库 的 标准 化 接口 a 33 
3.1 5| 言 ee 33 
3.1.1 背景 33 
3.1.2 术语 解释 34 
3.1.3 内容 仓 库 接 口 标准 化 的 趋势 36 
3.2 Java 内 容 仓库 APT RN 36 
3.2.1 JSR-170 规范 37 
3.2.2 JSR-170 的 兼容 级 别 pp 38 
3.2.3 JSR-170 的 优 题 和 39 
3.3 ”仓库 模型 39 
0 Ee 40 
3.3.2 工作 室 间 41 
3.3.3 节点 、 属 隆 和 和 条目 pp 43 
3.3.4 区 点 类 珊 44 
3.3.5 命名 室 间 44 
3.3.6 名称 与 路 径 Cn 45 
3.3.7 属性 45 
4 从 号 能 46 
i 问答 庆生 有 丽 和 47 
二 本 到 屡 取 仓 亩 内 容 Sen eo ge 47 
3.4.3 命名 空间 54 
3.4.4 XML 了 上映 冉 Ce 55 


.WH. 


企业 内 容 管理 理论 与 实践 


























3.4.$ 导出 仓库 肉 容 57 
5 本 一 撞 吉 在 康 内 矢 生 和 58 
i 61 
3.4.8 系统 节点 62 
3.4.9 访问 控制 62 
.5 明 吕 力 信 库 功 能 oD 63 
1 人 ee a 63 
3.5.2 ”添加 和 删除 命名 空间 ee 67 
53， 妾 大 他 岸 内 准 onminii i 68 
3.5.4 ”分配 节点 类 型 68 
es es 68 
一 司 这 的 个 头 动 能 69 
3.6.1 事务 69 
3.6.2 版 本 化 69 
3.6.3 ”观察 70 
3.6.4 ”锁定 70 
3.6.5 SQL 语法 搜索 71 
3.7 四 号 外 71 
第 4 章 内容 管理 互 操 作 性 服务 73 
4.1 CMIS 概述 73 
4.1.1 CMIS 的 历史 73 
4.1.2 CMIS 的 目标 74 
4.1.3 CMIS 中 没有 包括 的 功能 75 
4.2 CMIS 和 JCR 的 对 比 75 
4.3 ”CMIS 域 模型 75 
4.3.1 仓库 76 
4.3.2 对象 76 
4.3.3 对 象 类 弄 77 
4.3.4 文档 对 象 77 
本 久富 这 件 夹 对 妆 78 
4.3.6 关系 对 象 78 
市 二 了 策 腹 对 级 78 
4.3.8 访问 控制 79 
4.3.9 版 本 化 79 
4.3.10 ”查询 79 
4.3.11 更 改 日 专人 79 
4.4 服务 80 
本 未 工 _ 遂 用 服务 元 过 80 
























































4.4.2 仓库 服务 81 
4.4.3 导航 服务 81 
4.4.4 对 象 服 务 82 
外 水 3 风 存 档 服 务 82 
4.4.6 发 现 服 务 82 
未 计 天 术 服务 a 人 DD 82 
4.4.8 关系 服务 82 
4.4.9 策略 服务 82 
4.4.10 ACEL 服 务 82 
4.5 能 为 82 
4.5.1 导航 能 力 83 
4.5.2 对 象 能 力 83 
1 i 83 
S$ 玉 北 外 坟 eee cdr 84 
4.5.5 查询 能 力 pp 84 
4.5.6 ACEL 能 力 84 
第 二 可 时 能 办 有 和 和 84 
4.5.8 一 个 示例 85 
4.6 协议 绑 定 nn 85 
4.6.1 REST 风格 的 AtomPub 绑 定 ee 85 
4.6.2 Web Services 绑 定 en 86 
4.7 一 致 性 86 
4.7.1 规格 86 
4.7.2 域 模型 87 
4.7.3 REST 绑 宪 87 
太守 让 “冲服 务 缠 是 se 87 
4.8 行动 中 的 CMIS ee 87 
4. 8. 1 支持 CMIS 的 产品 88 
4. 8.2 支持 CMIS 的 闭 源 产品 站 90 
机 总 本 客户 靖 下 半生 91 
第 5 章 Web 服务 与 REST Ce 92 
$1- “SONP Sree 92 
5.1.1 SOAP 的 介绍 92 
5.1.2 SOAP 的 四 个 部 分 93 
5.1.3 ”SOAP 消息 的 格式 94 
全 95 
5.2.1 REST 的 介绍 95 
5.2.2 REST 关键 原则 97 


.X ， 


企业 内 容 管理 理论 与 实践 









































5.2.3 为 所 有 “事物 ”定义 ID ee 98 
5.2.4 将 所 有 事物 链接 在 一 超 99 
5.2.5 使 用 标准 方法 RN 99 
5.2.6 资源 多 重 表述 和 102 
5.2.7 无 状态 通信 103 
5.3 SOAP 对 比 REST Ce 103 
第 6 章 企业 内 容 管 理 系 统 体系 结 构 .pp 105 
6.1 和 集中 式 体 系 结构 105 
6.2 C/S 体系 结构 106 
6.2.1 CS 模型 ee 106 
6.2.2 CC/S 架构 的 特点 和 106 
6.3 B/S 体系 结构 107 
6.3.1 B/S 两 层 模 开 108 
6.3.2 B/S 三 层 模 弄 108 
6.3.3 ”B/S 四 层 模 弄 RN 109 
6.4 并 行 计算 110 
6.4.1 并 行 计 算 定义 及 特征 110 
6.4.2 并 行 计 算 体 系 结构 110 
6.4.3 ”并行 机 的 访 存 模 弄 112 
6.4.4 并 行 计 算 与 云 计 算 113 
6.5 分 布 式 系 统 PN 113 
6.5.1 分 布 式 系统 概述 pp 114 
6.5.2 分 布 式 系统 和 计算 机 网 络 系统 Ne 114 
6.5.3 分 布 式 系统 的 特性 115 
第 7 章 ”企业 内 容 管理 系统 的 部 署 117 
7.1 ”部署 模型 概述 117 
7.2 集中 式 系统 Ne 117 
7.3 双 机 热 笠 118 
7.3.1 双 机 热 备 综述 和 118 
7.3.2 双 机 热 备 的 实现 方案 pp 118 
7.3.3 双 机 热 备 产 鹿 Ne 120 
7.3.4 Pluswell 容错 软件 技术 简介 及 其 应 用 120 
7.4 集群 模式 123 
7.4.1 集群 技术 综述 124 
7.4.2 集群 的 必要 性 RN 124 
7.4.3 集群 的 可 扩展 性 pp 125 
7.4.4 集群 的 重要 指标 pp 131 
7.4.5 集群 的 分 类 134 




































































7.4.6 集群 设计 的 四 大 要 素 138 
7.$ 双 机 与 集群 的 异同 pe 142 
0 a a 142 
7.6.1 负载 均衡 定义 143 
7.6.2 负载 均衡 分 类 143 
7.6.3 负载 均衡 的 实现 方法 144 
7.6.4 负载 均衡 的 网 络 结构 145 
7.6.5 负载 均衡 的 优越 性 145 
第 8 章 IBM 的 FileNet P8 ee 147 
Bl TieNet De arom ee a i ee 147 
8.1.1 FileNet P8 技术 特性 ee 147 
8.1.2 FileNet P8 内 容 引 获 a 148 
8.1.3 FileNet P8 流程 引 获 4 150 
8.1.4 FileNet P8 应 用 引 获 4 150 
8.1.5 FileNet P8 转换 引 葡 ns 152 
8.2 FileNet P8 的 扩展 能 力 152 
8.3 ”内 容 管 理 对 象 153 
8.3.1 基于 内 容 管 理 的 应 用 环境 ee. 153 
8.3.2 个 性 化 界面 定制 153 
1 全 生生 请 全 半生 生生 仙 计 三 和 二 生生 生生 抽 生生 154 
8.3.4 流程 管理 154 
8.3.5 ”配置 管理 155 
8.3.6 ”应 用 开发 156 
.3.7 应 用 此 成 动能 ii 156 
S38 由 于 类 弟 管 再 ee 158 
8. 3.9 记录 管理 器 160 
8.3.10 ”电子 邮件 管理 161 
8.4 ”FileNet P8 内 容 管理 组 件 pp 161 
8.4.1 FileNet P8 捕获 程序 162 
8.4.2 基于 文档 的 构件 ee 162 
8.4.3 基于 内 容 联合 服务 Ne 163 
8.4.4 应 用 整合 RN 164 
8.4.5 FileNet 影像 服务 167 
第 9 章 微软 的 SharePoint RPR 168 
1 a 168 
9.T.1 Sharepoiit 灿 物 粮 击 et 168 

9.1.2 服务 器 体系 结构 pp 168 


9.1.3 SharePoint 的 技术 特点 170 


.XI . 


企业 内 容 管理 理论 与 实践 








































































































0: TA ODarepo ot aorver DOT. Sanne 171 
2 ”SharePoint 企业 内 容 管 理 PN 172 
.3 ”SharePoint 的 文档 管理 172 
9.3.1 用 户 角 色 类 型 173 
9.3.2 文档 管理 目标 173 
9.3.3 ”文档 管理 功能 173 
ie 1 174 
9.3.5 内容 管理 器 176 
9.4 数字 资产 管理 178 
9.4.1 功能 概述 178 
9.4.2 支持 的 方案 179 
oe 的 程 模 基 180 
9.$ 记录 管理 和 合 规 性 RN 181 
9. 5. 1 记录 管理 181 
9. 5.2 合 规 性 182 
9.5.3 ”记录 管理 编程 模型 PN 183 

6 电子 数据 展示 管理 和 pp 183 

7 “元 数据 管理 186 
9.7.1 托管 元 数据 概念 186 
9.7.2 托管 元 数据 的 使 用 PN 187 
Cn 人 
9.7.4 “元 数据 的 传输 与 存储 189 

8 ”管理 信息 策略 管理 pp 190 
9.9 内 容 管理 器 的 设置 Ne 191 
0091 这 首 内 从 oe 191 
9.9.2 内容 管 理 规则 192 
9.9.3 激活 内 容 管理 器 功能 PN 192 
第 10 章 Alfrescg .pt 194 
IQ 1 Alesed 这 ei 194 
10.1.1 Alfresco 多 视点 模型 194 
10.1.2 Alfresco 软件 体系 结构 PN 196 
10.1.3 Alfresco 系统 组 成 197 
10.2 ”Alfresco 的 功能 体系 架构 198 
10.2.1 Alfresco 内 容 管理 服务 器 198 
A RT 199 
10. 3 es 内容 服 芝 人 201 
10. 交 六 .Altesc0 赤 持 的 洲 议 cee 202 
10. 2. 5 Alfresco 应 用 编程 接口 203 




















10.2.6 Alfresco 内 容 模型 TT 206 
10.2.7 Alfresco 应 用 部 署 A Re CP et 208 
10.3 Alfresco 的 应 用 领域 ET TO TT 209 


参考 文献 a a 212 


第 工 章 ”内容 和 内 容 管理 


关于 内 容 一 词 的 理解 ， 有 很 多 含义 ， 在 不 同 的 语义 环境 中 有 不 同 的 意义 。 比 
如 源 于 出 版 媒体 业 ， 书 报 杂 志 、 唱 片 影 带 里 的 创作 ， 叫 做 内 容 。 内 容 管理 (Con- 
tent Management，CM) 是 指 对 组 织 机 构 内 部 多 种 格式 和 媒体 类 型 的 信息 资源 ， 
通常 称 为 信息 资产 的 组 织 、 分 类 、 管 理 等 有 序 化 过 程 ， 常 常 作为 数字 图 书馆 、 企 
业内 容 库 或 企业 知识 管理 的 一 个 组 成 部 分 。 早 期 的 内 容 管 理 ， 偏 向 出 版 产品 的 管 
理 ， 以 存储 、 流 程 、 元 数据 为 要 件 来 构建 系统 。 

企业 内 容 管理 (Enterprise Content Management，ECM) 关注 于 企业 内 部 以 及 
企业 之 间 的 文本 和 多 媒体 内 容 的 管理 ， 是 近年 来 一 个 新 兴 的 信息 管理 学 研究 
领域 。 

内 容 是 信息 的 使 用 ， 是 本 质 理解 和 技术 理解 的 统一 ， 是 两 者 的 结合 ， 准 确 理 
解 内 容 和 内 容 管理 的 概念 、 特 点 、 关 键 技术 、 发 展 趋 势 、 应 用 领域 ， 有 助 于 对 企 
业内 容 管理 这 一 信息 管理 领域 的 新 分 支 有 深刻 认识 。 


1.1 数据 、 信 息 和 内 容 























数据 、 信 息 和 内 容 之 间 是 相互 联系 ， 又 互 有 特征 的 关系 。 
1.1.1 什么 是 数据 


关于 什么 是 数据 ?有 不 同 的 说 法 和 理解 ， 百 度 百 科 中 这 么 解释 : 科学 实验 、 
含 验 、 统 计 等 所 获得 的 和 用 于 科学 人 研究、 技术 设计 、 查 证 、 决 策 等 的 数值 。 按 照 
这 种 解释 ， 数 据 可 以 理解 就 是 数值 。 在 《企业 内 容 管理 圣经 》 一 书 中 ， 作 者 认 
为 : 计算 机 被 用 来 进行 数据 处 理 。 也 可 以 认为 数据 是 由 一 些 计算 机 信息 的 小 片段 
组 成 ， 比 如 ， 数 字 、 文 字 、 图 像 、 声 音 等 。 在 本 书 中 ,采纳 后 一 种 理解 。 

简单 说 ， 数 据 是 未 加 工 过 的 “信息 ”， 而 信息 可 以 理解 为 这 些 数 字 、 文 字 、 
图 像 和 声音 中 包含 的 人 文 内 涵 。 今天， 人 们 呼吁 计算 机 处 理 内 容 ， 就 像 数 据 一 
样 ， 内 容 也 是 信息 ,但 内 容 保 留 了 人 类 的 理解 和 上 下 文 背景 。 

计算 机 最 初 设想 是 用 来 作为 一 种 处 理 计 算 的 工具 ， 这 种 计算 对 人 类 而 言 太 费 
时 或 太 复 杂 。 在 早期 的 日 子 里 ,计算 机 专业 人 员 是 程序 员 或 数据 输入 员 。 程 序 员 
简化 问题 为 一 系列 机 械 操作 ， 根 据 一 个 简单 的 格言 : 输入 数据 一 一 计算 机 处 
理 一 一 以 一 个 更 有 用 的 形式 输出 。 随 着 计算 机 技术 的 发 展 ， 计 算 机 的 使 用 自然 从 
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科学 到 制造 业 和 人 金融 等 管理 领域 ， 管 理 大 量 数字 仍 是 主要 事件 。 今 天 计算 机 已 经 
无 所 不 在 ， 在 设备 中 、 工 具 中 、 玩 具 中 、 工 艺 中 、 娱 乐 中 ， 当 然 ， 还 包括 工作 场 
所 。 但 计算 机 的 本 质 功 能 还 是 计算 部 分 。 计 算 部 分 是 一 个 非常 具体 的 数字 和 逻辑 
实体 运作 规则 的 有 限 集合 ， 可 以 产生 一 个 有 用 的 结果 的 一 部 分 。 

内 容 管理 的 基本 挑战 之 一 : 如 何 使 用 处 理 数 据 的 技术 ， 来 管理 和 处 理 非 数据 
化 的 内 容 ? 这 个 挑战 是 不 容易 应 对 的 。 计 算 机 被 设计 用 来 处 理 数据 ， 而 数据 是 被 
剥夺 了 任何 背景 和 独立 含义 的 数字 。 用 户 希 望 计算 机 能 够 处 理 内 容 , 但是， 内 容 
是 需要 丰富 的 背景 和 内 涵 的 。 如 果 像 处 理 数 据 一 样 处 理 信息 ， 那 么 会 变 得 机 械 、 
索然 无 味 、 使 用 者 很 难 理解 。 如 果 信 息 太 丰 富 ， 多 样 化 ， 与 上 下 文 关联 ， 又 很 难 
让 一 台 计 算 机 自动 化 管理 。 

目前 ， 处 理 这 个 挑战 的 思路 是 折 中 ， 用 一 个 数据 容 絮 〈 称 为 元 数据 ) 来 包 
装 信息 。 计 算 机 用 来 管理 元 数据 ， 而 有 趣 的 、 有 意义 的 信息 ， 也 就 是 非 数据 化 的 
内 容 撒 带 一 起 来 处 理 。 


1.1.2 信息 的 理解 


关于 信息 的 概念 和 定义 ， 也 有 很 多 理解 。 信 息 作 为 一 个 科学 术语 被 提出 和 使 
用 ， 可 追溯 到 1928 年 R. VHartly 在 《信息 传输 》 一 文中 的 描述 。 他 认为 : 信息 
是 指 有 新 内 容 、 新 知识 的 消息 。 而 关于 信息 ， 也 有 多 种 定义 。1948 年 ， 美 国 数 
学 家 、 信 息 论 的 创始 人 香农 博士 在 题 为 “通信 的 数学 理论 ”的 论文 中 ， 给 出 信 
息 的 数学 定义 ， 认 为 “信息 是 用 来 消除 随机 不 定性 的 东西 > ， 并 提出 信息 量 的 概 
念 和 信息 粹 的 计算 方法 ， 从 而 奠定 了 信息 论 的 基础 。1948 年 ， 美 国 著名 数学 家 、 
控制 论 的 创始 人 维 纳 在 其 专著 《控制 论 一 一 动物 和 机 器 中 的 通信 和 控制 问题 》 
一 书 中 ， 指 出 “信息 就 是 信息 ， 既 非 物 质 ， 也 非 能 量 ， 是 我 们 在 适应 外 部 世界 、 
控制 外 部 世界 的 过 程 中 ， 同 外 部 世界 交换 内 容 的 名 称 ”。1956 年 ， 英 国学 者 Ash- 
py 提出 “信息 是 集合 的 变异 度 ”， 认 为 信息 的 本 性 在 于 事物 本 身 具有 变异 度 。 
1975 年 ， 意 大 利 学 者 G. Longo 在 《信息 论 : 心得 趋势 与 未 决 问题 》 指 出 : 信息 
是 反映 事物 构成 、 关 系 和 差别 的 东西 ， 它 包含 在 事物 的 差异 之 中 ， 而 不 在 事物 的 
本 身 。 可 见 ， 至 今 为 止 ， 信 息 的 概念 仍然 仁者 见 仁 ， 智 者 见 智 。 

在 本 书 中 ， 采 纳 以 下 理解 : 信息 是 信息 论 中 的 一 个 术语 ， 常 常 把 消息 中 有 意 
义 的 内 容 称 为 信息 。 信 息 是 事物 存在 的 方式 或 运动 的 状态 ， 以 及 这 种 方式 、 状 态 
的 直接 或 间接 的 表述 ， 是 人 类 对 自然 世界 的 了 解 的 物化 形式 。 
1.1.2.1 信息 和 数据 的 关系 

言 息 是 事物 存在 的 方式 或 运动 的 状态 ， 以 及 这 种 方式 、 状 态 的 直接 或 间接 的 
表述 ， 是 人 类 对 自然 世界 的 了 解 的 物化 形式 。 数 据 是 未 加 工 过 的 “信息 ”， 只 是 
记录 信息 的 一 种 形式 。 下 面 例子 可 以 加 深 理解 信息 和 数据 之 间 的 关系 。 
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人 口 普查 数据 1996 年 美国 的 人 口 出 生 数 大 约 为 490 万 ， 在 这 里 ，490 万 表 
示 一 个 数据 值 。 但 是 如 果 将 该 数据 与 前 40 年 的 出 生 数 关联 ， 可 以 导出 一 些 有 用 
的 信息 : 

1) 20 世纪 50 年 代 和 20 世纪 60 年 代 早 期 “婴儿 高 潮 ” 中 出 生 的 人 正在 变 
老 ， 正 在 其 生育 年 龄 结束 前 作 最 后 的 生育 努力 。 

2) 20 世纪 60 年 代 末 到 70 年 代 中 期 出 生 的 那 氢 人 ， 已 经 开始 他 们 的 生育 
年 代 。 

另外 ， 该 人 口 普 查 数 据 还 可 以 与 其 他 似乎 无 关 的 信息 相关 联 ， 例 如 ， 将 在 下 
个 十 年 退休 的 初级 中 学 教师 的 当前 数量 ; 具有 初级 和 中 级 教育 程度 毕业 的 学 生 
数 ; 或 政治 家 承受 的 降低 税率 并 因此 限制 教师 薪金 增长 的 压力 。 

这 些 信息 还 可 以 被 组 合 而 形成 知识 的 表示 : 在 21 世纪 的 第 一 个 十 年 ， 人 口 
将 对 美国 的 教育 系统 有 较 大 的 压力 ， 该 压力 将 持续 十 年 以 上 。 根 据 该 知识 ， 一 个 
商业 机 会 可 能 形成 ， 将 存在 重要 的 机 会 去 开发 新 的 比 当前 的 方法 更 有 效 和 更 价 廉 
的 学 习 模 式 。 

类 似 的 例子 ， 也 可 以 应 用 在 我 国 目前 的 人 口 现状 分 析 上 ， 据 报道 ， 到 2013 
年 底 ， 我 国 老年 人 口 总 数 将 超过 2 亿 ， 到 2015 年 ， 老 年 人 口 总 数 将 达到 2. 21 
亿 ， 占 总 人 口 的 16% ， 人 口 老龄 化 形势 严峻 。 根 据 该 数据 关联 的 信息 分 析 ， 那 
么 新 的 老龄 事业 也 可 以 由 政府 和 商家 来 考虑 策划 。 
1.1.2.2 信息 的 性 质 和 特点 

信息 具有 不 灭 性 。 信 息 不 像 物质 和 能 量 ， 物 质 是 不 灭 的 ， 能 量 也 是 不 灭 的 ， 
其 形式 可 以 转化 ， 但 信息 的 不 灭 性 同 它们 不 一 样 。 一 个 杯子 被 打 碎 了 ， 构 成 杯子 
的 物质 的 原子 、 分 子 没有 变 ， 但 已 不 成 为 一 个 杯子 。 又 如 能 量 ， 我 们 可 以 把 电能 
变 成 热能 ， 但 变 成 热能 后 电能 已 经 没有 了 。 而 信息 的 不 灭 性 是 一 条 信息 产生 后 ， 
其 载体 可 以 变换 ， 可 以 被 毁 掉 ， 如 一 本 书 、 一 张 光 盘 ， 但 信息 本 身 并 没有 被 消 
灭 ， 所 以 ， 信 息 的 不 灭 性 是 信息 的 一 个 重要 特点 。 

言 息 可 以 廉价 复制 ， 可 以 广泛 传播 。 信 息 的 复制 不 像 物 体 的 复制 ， 一 条 信息 
复制 成 100 万 条 信息 费用 十 分 低廉 。 尽 管 信息 的 创造 可 能 需要 很 大 的 投入 ， 但 复 
制 只 需要 载体 的 成 本 ,可 以 大 量 地 复制 ， 广泛 地 传播 。 

某 些 信息 的 价值 有 很 强烈 的 时 效 性 。 一 条 信息 在 某 一 时 刻 价 值 非常 高 ， 但 过 
了 这 一 时 刻 ， 可 能 一 点 价值 也 没有 。 现 在 的 金融 信息 ， 在 需要 知道 的 时 候 ， 会 非 
常 有 价值 ， 但 过 了 这 一 时 刻 ， 这 一 信息 就 会 毫 无 价值 。 又 如 战争 时 的 信息 ， 敌 方 
的 信息 在 某 一 时 刻 有 非常 重要 的 价值 ， 可 以 决定 战争 或 战役 的 胜 负 ， 但 过 了 这 一 
时 刻 ， 这 一 信息 就 变 得 毫 无 用 处 。 所 以 说 ， 相 当 部 分 的 信息 有 非常 强 的 时 效 性 。 
1.1.2.3 信息 技术 的 概念 

信息 技术 也 称 为 信息 科学 技术 ， 是 一 门 主要 研究 信息 的 产生 、 获 取 、 表 达 、 
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加 工 、 传 播 、 存 储 、 转 换 和 使 用 的 技术 。 它 以 微 电 子 、 计 算 机 、 软 件 、 通 信 技 术 
为 主导 ， 微 电子 是 基础 ， 计 算 机 及 通信 设施 是 载体 ， 软 件 是 核心 ， 也 是 计算 机 的 
灵魂 。 

信息 技术 是 与 信息 活动 有 关 的 、 以 增强 人 类 信息 功能 为 目的 的 技术 ， 是 应 用 
言 息 科学 的 原理 和 方法 有 效 地 利用 信息 资源 的 技术 体系 。 

言 息 技术 的 发 展 规律 : 

1) 辅 人 律 一 一 以 满足 人 类 需要 为 中 心 。 

2) 共生 律 一 一 以 人 类 信息 运动 规律 为 依据 。 

3) 倍增 律 一 一 以 摩尔 定律 为 标志 。 

信息 技术 的 研究 热点 : 

1) 人 工 智 能 技术 (专家 系统 、 神 经 计算 机 ) 。 

2) 多 媒体 技术 (多 样 性 、 集 成 性 、 交 互 性 ) 。 

3) 光缆 技术 。 

4) 卫星 通信 。 

言 息 技 术 对 人 类 学 习 的 影响 

1) 阅读 方式 的 变革 。 

2) 写作 方式 的 变革 。 

3) 计算 方式 的 变革 。 

4) 教育 时 间 的 变革 。 

5) 参加 制定 学 习 计 划 与 自主 学 习 。 

6) 教师 变 为 学 生 顾问 。 

言 息 技术 的 社会 作用 : 

1) 推动 社会 生产 力 的 变革 。 

2) 提高 人 类 社会 开发 利用 信息 资源 的 能 

信息 产业 是 围绕 着 信息 技术 开展 的 产业 ， 也 就 是 进行 信息 的 收集 、 整 理 、 存 
储 、 传 输 、 处 理 及 其 应 用 服务 的 产业 ， 目 前 已 成 为 世界 第 一 大 产业 。 信 息 技 术 
推广 应 用 的 显著 成 效 ， 促 使 世界 各 国 致力 于 信息 化 ， 而 信息 化 的 巨大 需求 又 驱 
使 信息 技术 高 速 发 展 。 当 前 信息 技术 发 展 的 总 趋势 是 以 互联 网 技术 的 发 展 和 应 
用 为 中 心 ， 从 典型 的 技术 驱动 发 展 模 式 向 技术 驱动 与 应 用 驱动 相 结 合 的 模式 
转变 。 

互联 网 的 应 用 开发 也 是 一 个 持续 的 热点 。 一 方面 ， 电 视 机 、 手 机 、 个 人 数字 
助理 (PDA) 等 家 用 电器 和 个 人 信息 设备 都 向 网 络 终端 设备 的 方向 发 展 ， 形 成 
了 网 络 终端 设备 的 多 样 性 和 个 性 化 ， 打 破 了 计算 机 上 网 一 统 天 下 的 局 面 ; 另 一 方 
面 ， 电 子 商务 、 电 子 政务 、 远 程 教育 、 电 子 媒体 、 网 上 娱乐 技术 日 趋 成 熟 ， 不 断 
降低 对 使 用 者 的 专业 知识 要 求 和 经 济 投入 要 求 ; 互联 网 数据 中 心 (IDC) 、 网 站 
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服务 等 技术 的 提出 和 服务 体系 的 形成 ， 构 成 了 对 使 用 互联 网 日 益 完 善 的 社会 化 服 
务 体系 ， 使 信息 技术 日 益 广 泛 地 进入 社会 生产 、 生 活 各 个 领域 ， 从 而 促进 了 网 络 
言 息 经 济 的 形成 。 


1.1.3 内 容 的 理解 


中 文 的 “内 容 ” 对 应 英文 的 Content。 关 于 内 容 ， 目 前 有 四 种 理解 : 内 容 的 
字面 理解 ， 内 容 的 本 质 理 解 ， 内 容 的 哲学 理解 ， 内 容 的 技术 理解 。 
1.1.3.1 包含 的 东西 

从 内 容 的 中 文字 面 理解 ， 内 容 就 是 物件 里 面 所 包容 的 东西 。 比 如 抽 屠 里 的 内 
容 ， 代 表 抽 居 里 面 的 东西 ; 例如， 和 鲁迅 的 《而 已 集 . 再 谈 香 港 》 中 写 到 , “检查 
员 的 脸 是 青色 的 …… 他 只 将 箱子 的 内 容 倒 出 ， 翻 搅 一 通 ”; 郭沫若 的 《北伐 途 
次 》 中 写 到 ,“ 那 个 钱包 是 皮 制 的 ， 已 经 很 日 了 ， 当 着 众人 面前 我 替 他 打开 来 ， 
从 那里 面 取出 的 内 容 是 : 两 个 铜板 和 两 张 当 票 "”。 这 几 个 例子 都 说 明了 内 容 
的 字面 理解 ， 就 是 所 包容 的 东西 。 

这 个 定义 提供 了 一 个 内 容 理解 的 很 好 的 视图 : 别 的 东西 所 包含 的 东西 。 从 信 
息 到 内 容 ， 就 可 以 考虑 为 从 东西 到 其 容器 的 转变 ,信息 的 容器 就 是 一 系列 分 类 和 
元 数据 的 集合 ， 我 们 从 关注 信息 本 身 ， 把 焦点 转 到 围绕 它 的 元 数据 上 。 
1.1.3.2 内 容 的 本 质 理解 

除了 字面 理解 的 所 包容 的 东西 以 外 ， 还 有 一 种 从 本 质 上 面 的 理解 ， 内 容 是 事 
物 内 部 所 含 的 实质 或 意义 ， 是 事物 上 下 文 的 内 涵 。 例如， 丁玲 的 《 韦 护 》 第 二 
章 中 写 到 ,“ 他 一 天 天 的 感 出 这 些 文学 巨著 内 容 的 伟大 ”; 阿 英 的 《 晚 清 小 说 史 》 
第 三 章 中 写 到 , “ 《冷眼 观 》 与 《二 十 年 目睹 之 怪 现状 》 类 似 ， 首 回 说 明 本 书 内 
容 ， 都 是 旧 社 会 的 怪事 ”。 

上 面 两 例 是 从 文学 作品 中 分 析 ， 也 说 明了 人 们 一 般 情况 下 对 内 容 的 理解 。 
1.1.3.3 内 容 的 哲学 理解 

从 文学 作品 里 面 ， 内 容 分 物件 所 包含 的 东西 以 及 事物 内 部 所 含 的 实质 两 种 理 
解 ， 如 果 从 哲学 层面 来 理解 内 容 的 话 ， 内 容 指 事物 内 在 因素 的 总 和 。 这 种 理解 
“内 容 ” 与 “形式 ”相对 。 世 界 上 任何 事物 没有 无 形式 的 内 容 ， 也 没有 无 内 容 的 
形式 。 内 容 决定 形式 ， 形 式 依赖 内 容 ， 并 随 着 内 容 的 发 展 而 改变 。 但 形式 又 反 作 
用 于 内 容 ， 影 响 内 容 ， 在 一 定 条 件 下 还 可 以 对 内 容 的 发 展 起 有 力 的 促进 作用 。 内 
容 和 形式 是 辩证 的 统一 。 它 与 形式 是 里 和 表 的 关系 ， 是 肉 和 皮 的 关系 。 
1.1.3.4 内 容 的 技术 理解 

从 技术 层面 来 看 ， 内 容 可 以 理解 是 一 个 互联 网 术语 。“ 内 容 ” 一 词 ， 源 于 出 
版 媒体 业 ， 书 报 杂 志 、 唱 片 影 带 里 的 创作 ， 叫 做 内 容 。 随 着 网 络 的 普遍 使 用 ， 企 
业内 部 信息 的 流通 加 速 、 文 案 与 资料 数量 增加 ， 像 电子 邮件 、 从 Lotus Notes 来 
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的 资料 、 网 上 讨论 、 实 时 简讯 、Office 文案 、 网 页 上 的 文字 和 图 片 ， 甚 至 是 印刷 
资料 的 内 容 ， 即 使 不 是 出 版 媒体 机 构 ， 也 有 加 强 管理 这 些 资料 的 必要 性 。 于 是 ， 
“内 容 ” 就 由 原来 的 出 版 媒体 内 容 ， 扩 大 成 企业 内 部 全 部 资料 信息 的 内 容 了 ， 同 
时 也 产生 了 “企业 内 容 管理 ”的 新 名 词 。 

内 容 管理 在 几 年 前 ， 还 是 一 个 通称 ， 旱 期 的 内 容 管理 ， 偏 向 出 版 产品 的 管 
理 ， 以 存储 、 流 程 、 元 数据 为 要 件 来 制作 系统 。 存 储 多 以 关联 式 数据 库 的 方式 ， 
有 的 也 以 一 般 数 据 文件 方式 存储 ， 或 者 是 根据 需要 两 种 并 存 。 内 容 从 制作 编辑 到 
成 品 存储 ， 都 需 经 过 或 多 或 少 的 加 工 过 程 ， 有 的 是 单线 的 简单 流程 ， 有 的 是 分 又 
多 线 的 并 行 操作 ， 各 种 流程 不 同 、 相 差 其 远 。 至 于 元 数据 ， 是 对 内 容 的 描述 ， 如 
作者 、 日 期 、 关 键 词 、 媒 体 种 类 、 版 权 等 ， 都 以 XML (可 扩展 标记 语言 ) 标记 
的 方式 记录 ， 来 达到 跨 媒体 出 版 与 个 人 化 出 版 的 目标 。 

目前 ， 还 没有 任何 单一 的 系统 ， 能 适用 于 所 有 出 版 媒体 内 容 的 管理 。 各 种 内 
容 虽 然 在 数字 化 之 后 都 是 电子 数据 ， 可 以 采用 数字 管理 方式 来 处 理 ， 但 在 应 用 的 
层面 上 ， 却 复杂 得 多 。 内 容 从 制作 、 分 送 到 存储 ， 生 命 周期 的 每 一 阶段 ， 在 处 理 
上 都 有 不 同 的 需求 。 
1.1.3.5 内 容 理解 的 范围 不 断 扩 大 

从 上 面 资料 的 分 析 当 中 ， 不 难 理解 ， 广 义 地 说 内 容 既 包括 形式 上 的 内 容 ， 如 
某 一 学 科 课 程 的 内 容 ， 也 包括 实体 上 的 内 容 ， 如 大 米饭 等 。 内 容 一 词 就 是 人 在 生 
活 当 中 为 了 更 方便 表达 这 类 事物 现象 而 出 现 的 一 种 语义 表达 符号 。 因 此 ， 用 在 不 
同 的 领域 或 者 不 同 的 行业 方面 ， 其 基本 意义 是 相同 的 。 它 的 呈现 可 以 由 形式 揭示 
出 内 容 ， 人 们 也 可 以 由 内 容 大 致 推测 出 形式 类 型 。 比 如 ， 人 们 提 到 精神 面貌 ， 就 
有 很 多 内 容 去 填充 ， 相反， 人 们 也 可 以 由 干事 有 干劲 ， 归 纳 到 它 归 属于 精神 之 内 
容 表现 。 

在 本 书 中 ， 更 倾向 于 内 容 是 本 质 理解 和 技术 理解 的 统一 ， 是 两 者 的 结合 。 事 
物 内 部 所 含 的 实质 或 意义 ， 从 呈现 来 看 ， 必 须 有 一 定 的 形式 ， 必 须 有 一 定 的 载 
体 ; 而 从 管理 的 角度 来 看 ， 内 容 更 多 体现 为 形式 ， 内 容 管 理 也 就 是 承载 内 容 的 形 
式 载体 的 管理 。 


1.2 ”内容 到 底 是 什么 























1.2.1 内 容 不 是 数据 


众所周知 ， 计 算 机 的 主要 功能 是 对 数据 进行 处 理 ， 这 种 理解 根深 带 固 ， 时 至 
今日 ， 数 据 处 理 仍 将 是 计算 机 要 做 的 主要 事情 。 男 一 方面 ， 大 家 都 知道 ， 大 多 数 
用 户 希 望 计算 机 能 对 成 堆 的 信息 小 片段 ， 做 更 多 的 精细 处 理 。 今 天 ， 人 们 希望 计 
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算 机 能 够 通过 大 的 、 完 整 的 块 (不 是 片段 ) 的 处 理 ， 在 他 们 最 希望 得 到 的 那 一 
刻 ， 得 到 并 提供 信息 。 此 外 ， 人 们 和 希望 计算 机 从 他 们 比较 熟悉 的 来 源 ， 如 书籍 、 
广播 、 电 视 和 电影 中 ， 提 供 有 质量 的 信息 。 

随 着 计算 机 处 理 能 力 的 增强 ， 从 制造 业 到 金融 等 商业 领域 ,计算 机 从 作为 打 
字 机 和 以 纸张 为 基础 的 电子 表格 的 蔡 代 品 转移 到 商用 业务 处 理 领域 。 近 些 年 ， 在 
个 人 电脑 行业 产生 的 下 面 三 个 相关 的 事态 发 展 ， 让 我 们 期 望 计算 机 可 以 突破 以 往 
的 处 理 领域 ， 可 以 进入 另 一 个 重大 变化 的 阶段 : 

1) 数字 媒体 创作 (图 像 、 声 音 和 视频 ) 成 为 可 能 。 

2) 数字 媒体 输出 〈 彩 色 显 示 器 、 声 卡 和 视频 加 速 器 ) 变 为 可 用 。 

3) 面向 消费 者 的 大 众 移动 存储 (CD-ROM 等 ) 成 为 可 用 而 且 价格 便宜 。 

上 述 三 个 相关 趋势 的 发 展 导致 多 媒体 产业 异军突起 ， 在 传统 产业 中 大 量 使 用 
多 媒体 ， 人 们 第 一 次 可 以 很 快 创建 和 廉价 提供 实际 内 容 ， 而 不 仅仅 是 数据 。 多 媒 
体 组 成 的 数字 资产 激增 ， 提 供 从 百科 全 书 和 分 类 目录 到 全 动态 游戏 等 一 切 内 容 。 
计算 机 开始 成 为 一 个 信息 渠道 ， 替 代 传统 的 提供 内 容 ， 而 不 是 数据 的 信息 来 源 ， 
比如 书籍 、 电 视 机 和 收音 机 。 

伴随 着 多 媒体 产业 的 兴起 ，Web 也 取得 了 广泛 的 应 用 。 如 今 ， 在 线 获取 内 
容 , 不仅 是 可 能 的 ， 而 且 往 往 比 以 任何 其 他 方式 更 好 。 现 在 ， 人 们 更 多 地 会 通过 
笔记 本 电脑 和 个 人 数字 助理 (PDA) 听 音 乐 、 在 线 交 流 ， 而 不 是 通过 电台 或 电 
话 。 不 过 ， 相 信 很 多 人 都 会 有 这 样 的 体会 ， 无 论 何 时 ， 当 使 用 Web 希望 迅速 找 
到 想 要 的 内 容 时 ， 并 不 总 是 会 如 愿 ， 这 通常 让 人 感到 诅 形 。 如 何 有 效 地 对 Web 
内 容 进行 组 织 和 管理 ， 是 不 得 不 面临 的 问题 。 

虽然 用 户 的 需求 和 期 望 改变 了 ， 但 计算 机 的 本 质 却 没有 改变 ， 还 是 对 数据 进 
行 处 理 。 十 多 年 前 ， 大 多 数 人 使 用 计算 机 来 输入 、 处 理 和 输出 数据 。 今 天 ， 大 多 
数 人 使 用 计算 机 来 寻找 和 消费 内 容 。 然 而 ， 所 有 计算 机 技术 的 基础 ， 仍 然 是 这 个 
想法 : 简化 任何 问题 为 一 系列 简单 的 指令 集 ， 工 作 于 离散 和 结构 片段 。 

当然 ， 数 据 和 内 容 是 不 同 的 ， 但 这 种 差异 并 不 意味 着 它们 无 法 交互 。 事 实 
上 ， 每 天 都 会 发 生 无 数 个 从 一 个 到 男 一 个 的 过 渡 。 此 外 ， 从 计算 机 系统 的 角度 来 
看 ， 内 容 不 存在 一 一 只 有 数据 存在 。 内 容 是 以 承载 内 容 的 形式 载体 出 现 的 ， 很 少 
有 一 些 作为 内 容 处 理 内 容 的 工具 ， 相 反 ， 必 须 把 它 作 为 数据 来 对 待 ， 这 样 计算 机 
才 可 以 存储 、 检 索 、 处 理 并 显示 它 。 

例如 ， 考 虑 一 个 典型 的 Web 互动， 打开 一 个 电子 商务 网 站 ， 浏 览 一 个 网 页 ， 
它 显 示 一 个 您 喜欢 的 图 书 的 介绍 页 面 ; 把 它 添加 到 您 的 购物 车 ， 然 后 为 它 结算 文 
付 。 您 的 经 验 是 一 系列 有 关 图 书 以 及 您 使 用 购买 的 一 些 按钮 和 其 他 控件 的 信息 组 
成 的 Web 页 面 ， 总 而 言 之 ， 感 觉 就 像 一 个 内 容 丰 富 的 Web 互动 经 验 。 然 而 ， 幕 
后 发 生 的 事情 ， 是 一 系列 面向 数据 的 计算 机 程序 与 数据 库 交 换 数 据 。 
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通过 这 个 例子 ， 我 们 意识 到 利用 数字 内 容 工 作 ， 并 非 人 们 期 望 的 那么 便利 ， 
即使 看 起 来 似乎 令 人 信服 ， 那 只 是 因为 有 人 在 幕后 做 了 大 量 的 努力 ， 使 一 切 显得 
那么 容易 和 令 人 信服 。 其 实 ， 内 容 使 用 的 自然 化 和 便利 化 是 一 个 非 自然 的 辛 藻 
过 程 。 

一 些 幕 后 的 数据 是 非常 类 似 内 容 的 。 例 如 ， 一 个 数据 库存 储 图 书 的 封面 图 
片 ， 在 这 里 ， 图 书 的 介绍 包括 文本 和 图 片 都 是 内 容 ， 通 过 扩展 数据 操作 技术 ， 把 
内 容 存放 在 数据 库 表 的 字段 中 。 图 书 的 名 字 是 在 一 个 字段 ， 图 书 的 介绍 文本 在 另 
一 个 字段 ， 第 三 个 字段 包含 了 图 书 的 封面 图 片 。 

男 一 些 莫 后 的 数据 是 非常 类 似 数据 的 ， 它 由 数字 和 其 他 片段 组 成 ,这些 数 
字 创 造 你 和 图 书 在 线 公 司 之 间 的 经 济 交 易 。 例 如 ， 数 据 库存 储 你 的 信用 卡号 
码 、 你 的 订单 号 码 、 订 购 的 数量 和 订单 价格 ， 以 及 使 用 这 些 数字 和 其 他 算法 进 
行 计算 。 

还 有 些 幕 后 数据 是 介 于 数据 和 内 容 之 间 的 。 例 如 ， 著 名 的 电子 商务 网 站 一 一 
当当 网 ， 在 售 的 图 书目 录 包 含 图 书 名 称 、 出 版 时 间 、 价 格 和 其 他 信息 ， 如 图 1-1 
所 示 。 这 些 信息 片段 由 各 类 数据 组 成 ， 在 网 站 的 数据 库 中 存储 ， 但 它们 在 网 站 中 
显示 的 时 候 ， 更 倾向 于 作为 内 容 的 风格 显示 。 
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到 1-1 当当 网 的 网 站 存储 内 容 展示 


原因 非常 简单 ， 如 果 网 站 看 起 来 像 数 据 的 堆砌 ， 而 没有 内 容 风 格 ， 那 么 是 无 
法 吸引 和 留 住 客户 的 。 

其 实 ， 在 数据 库 中 ， 这 一 切 都 只 是 数据 。 在 页 面 上 ， 交 易 数 据 仍然 看 起 来 有 
点 像 数 据 ， 而 图 书 功 能 介绍 文章 的 数据 看 起 来 一 点 都 不 像 数 据 ， 目 录 数 据 可 以 保 
留 或 失去 其 数据 的 外 观 。 然 而 ， 在 一 个 精心 设计 的 页 面 ,访问 者 感知 它 为 内 容 。 

因此 ， 从 用 户 的 角度 来 看 ,信息 是 所 有 内 容 。 而 从 计算 机 程序 员 的 角度 来 
看 ， 全 都 是 数据 。 在 这 样 一 个 仍然 是 数据 驱动 技术 的 时 代 ， 内 容 管 理 的 技巧 ， 是 
使 用 数据 处 理 技 术 来 存储 和 显示 内 容 。 














1.2.2 内 容 是 信息 的 使 用 


在 计算 机 世界 中 的 人 或 多 或 少 会 同意 对 数据 的 定义 。 数 据 被 认为 是 人 们 收 
集 、 整 理 加 入 到 数据 记录 中 ， 并 在 数据 库 中 存储 的 信息 小 片段 。 以 行 和 列 二 维 表 
的 结构 形式 存在 ， 所 以 也 可 以 理解 为 结构 化 后 的 信息 形式 。 

另 一 方面 ， 信 息 包含 了 很 多 的 意义 ， 采 用 正确 的 方法 ， 你 可 以 操作 任何 东 
西 ， 包 括 信息 、 数 据 。 在 本 书 中 ， 采 用 一 个 非常 平凡 的 定义 ， 信 息 意味 着 所 有 常 
见 的 被 记录 的 通信 形式 ， 包 括 : 

1) 文本 ， 比 如 文章 、 书 和 新 闻 。 

2) 声音 ， 比 如 音乐 、 对 话 和 阅读 。 

3) 图 片 ， 比 如 照片 和 插图 。 

4) 运动 ， 比 如 视频 和 动画 。 

5) 计算 机 文件 ， 比 如 电子 表格 、 幻 灯 片 和 其 他 你 可 能 希望 找到 和 使 用 的 
文件 。 

关于 信息 的 理解 ， 在 《内 容 管理 圣经 》 中 ，Bob 认为 : 信息 是 当 人 类 想 要 传 
达 给 其 他 人 时 ， 改 造 自 己 知识 的 转化 的 产物 。 它 是 知识 的 可 见 或 可 听 ， 以 书写 、 
印刷 文字 或 讲话 的 形式 。 

从 用 户 的 观点 来 看 ， 信 息 是 当 我 们 需要 增加 或 丰富 我 们 的 知识 以 付 诸 行动 的 
时 候 ， 我 们 寻找 和 关注 外 部 地 界 的 东西 ， 一 旦 我 们 找到 它 ， 就 把 它 转化 为 知识 。 

你 可 以 正确 地 调用 任何 信息 ， 信 息 需要 转换 ， 才 可 以 为 那些 需要 将 它 增 加 到 
自己 的 知识 和 使 用 它 的 人 类 服务 ， 信 息 的 改造 和 转化 是 困难 的 ， 在 所 有 常见 的 记 
录 通 信 形 式 的 背后 ， 人 们 做 了 大 量 的 工作 。 那 些 可 见 的 或 可 听 的 产品 ， 打 印 或 电 
子 的 纸张 ， 都 是 信息 使 用 的 方式 ， 它 们 体现 了 知识 转化 为 信息 化 改造 的 结果 ， 是 
一 个 不 可 分 割 的 内 容 和 容器 结合 。 

在 你 看 到 一 条 信息 之 前 ， 别 人 已 经 做 了 很 多 工作 。 其 他 人 已 经 形成 了 一 个 概 
念 的 精神 形象 来 沟通 ， 使 用 创意 和 智慧 ， 起 草 文字 、 声 音 或 图 像 以 适合 这 个 概 
念 ; 然后 用 一 些 像样 的 方式 记录 信息 ， 在 其 他 人 看 到 它 之 前 ， 已 经 给 信息 注入 了 
大 量 的 个 性 和 背景 。 因 此 ， 与 数据 不 同 ， 信 息 不 能 很 自然 地 以 相同 的 方式 显示 相 
同 的 结构 和 行为 。 信 息 具 有 时 效 性 ， 往 往 持 续 变 化 ， 没 有 标准 的 开始 、 结 束 或 属 
性 。 如 有 果 你 打破 了 信息 ， 改 变 它 ， 那 么 会 失去 原 有 的 智慧 和 创造 性 ， 失 去 作者 表 
达 的 意思 。 

关于 内 容 是 什么 ， 美 国信 息 与 图 像 管理 协会 给 出 了 一 个 关于 内 容 的 定义 : 当 
为 了 一 个 或 多 个 目的 ， 给 原始 的 信息 赋予 一 个 可 用 的 形式 时 ， 信 息 变 成 内 容 。 内 
容 的 价值 日 益 取决 于 主要 可 用 的 结合 形式 ， 比 如 它 的 应 用 、 方 便 性 、 用 法 、 用 
人 处、 品牌 知名 度 和 独特 性 。 





















































"10. 企业 内 容 管理 理论 与 实践 





因此 ， 我 们 可 以 说 ， 内 容 是 信息 的 使 用 ， 是 信息 使 用 载体 的 集合 。 
1.2.3 ”内容 是 信息 + 数据 


像 数据 一 样 简单 地 对 待 信息 是 完全 不 可 能 的 ， 信 息 有 太 多 人 为 因素 和 直觉 
性 。 对 于 数据 ， 你 所 看 到 的 就 是 你 得 到 的 。 对 于 信息 ， 它 传达 的 表象 很 多 不 是 实 
际 的 信息 内 涵 。 相 反 ， 在 创建 或 消费 的 人 的 头脑 中 ， 信 息 存 在 于 一 个 更 广泛 的 内 
涵 、 背 景 和 解释 的 世界 中 。 这 些 都 使 得 它 根本 不 适合 数据 处 理 模型 。 事 实 上 ， 数 
据 的 概念 是 专门 从 信息 中 删除 这 些 主观 的 因素 ， 使 计算 机 能 够 严格 、 逻 辑 精密 地 
管理 。 

计算 机 的 处 理 是 基于 数据 模型 的 ， 它 不 能 真正 地 管理 信息 。 直 到 出 现 一 个 新 
的 计算 机 处 理 模型 ， 可 以 使 用 数据 时 代 的 工具 来 处 理 信息 的 方法 、 流 程 和 程序 ， 
而 不 是 简单 地 减少 信息 到 数据 ， 你 可 以 捕获 完整 的 、 有 意义 的 信息 块 ， 用 描述 数 
据 包 装 它 ， 以 便 计算 机 可 以 读 取 和 操作 。 

用 数据 来 标记 大 块 的 信息 ， 计 算 机 可 以 访问 和 操作 数据 。 元 数据 是 关于 数据 
的 数据 。 但 它 远 不 止 此 ， 元 数据 是 为 计算 机 理解 和 工作 的 信息 的 背景 和 意义 的 简 
化 版 本 。 元 数据 使 得 信息 的 背景 和 意义 足够 明确 ， 计 算 机 可 以 直接 处 理 。 给 信息 
添加 数据 ， 也 就 是 元 数据 ， 可 以 有 效 地 把 保持 信息 的 整体 性 和 使 用 数据 技术 有 效 
管理 信息 两 者 区 分 开 。 元 数据 ， 是 一 个 让 上 下 文 、 内 涵 和 解释 清晰 的 方式 ， 更 重 
要 的 是 ， 元 数据 可 以 明确 你 希望 解释 信息 的 方式 。 

从 这 个 意义 上 来 说 ， 内 容 就 是 使 用 数据 来 标记 的 信息 ， 使 计算 机 人 能够 组织 
化 、 系 统 化 地 收集 、 管 理 和 发 布 它 。 如 果 可 以 应 用 数据 的 处 理 方法 ， 而 又 不 挤 压 
信息 的 兴趣 和 意义 ,那么 这 样 的 一 个 内 容 管理 系统 是 成 功 的 。 

除非 计算 机 (或 一 些 较 新 的 技术 ) 可 以 直接 处 理 内 容 ， 否则 你 必须 弄 清楚 
如 何 使 用 数据 处 理 技术 来 收集 和 提供 内 容 。 使 用 数据 人 处理 技术 来 处 理 内 容 ， 也 是 
现 阶段 内 容 管 理 要 遵循 的 一 个 中 心思 想 。 























1.3 内容 管理 


1.3.1 内 容 管理 基本 概念 


内 容 管理 是 电子 商务 时 代 的 新 宠 ， 是 一 个 新 兴 的 市 场 ， 对 于 内 容 管理 ， 业 界 
还 没有 一 个 统一 的 定义 ， 不 同 的 机 构 有 不 同 的 理解 。 内 容 管理 的 目的 不 是 把 所 有 
的 数据 都 转化 为 内 容 。 内 容 管理 的 目的 是 监督 信息 的 创建 和 管理 ， 以 及 与 现 有 的 
数据 系统 的 信息 整合 。 在 所 有 情况 下 ， 内 容 管理 系统 必须 承担 创建 最 终 出 版 物 的 
责任 。 如 果 出 版 物 中 包含 数据 和 内 容 ， 内 容 管理 系统 要 确保 在 正确 的 地 方 出 现 正 
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确 的 数据 和 内 容 ， 并 统一 和 连贯 地 呈现 给 最 终 消 费 者 。 

IBM 公司 曾 把 信息 管理 定义 为 数据 管理 (Data Management，DM) 和 内 容 管 
理 (CM) 两 部 分 的 集成 ， 显 示 出 内 容 管理 的 重要 性 。 内 容 管理 不 是 某 种 单独 的 
创新 技术 ， 而 是 许多 先进 技术 的 综合 应 用 ， 它 涵盖 企业 内 联网 (Intranet) 、 因 特 
网 (Internet) 和 企业 外 联网 (Extranet) 的 应 用 ， 大 大 突破 了 传统 信息 流 管理 软 
件 、 办 公 眉 动 化 软件 以 及 文档 管理 软件 的 应 用 范围 、 使 用 效果 和 商业 价值 。 

内 容 管 理 本 身 由 “内 容 ” 和 “管理 ”两 部 分 组 成 。 所 谓 “ 内 容 ”， 在 前 面 
我 们 已 经 进行 了 多 方位 的 分 析 理 解 ， 内 容 是 信息 的 使 用 ， 更 多 体现 为 形式 ， 就 是 
具有 价值 的 、 能 够 容易 的 数字 化 、 安 全 的 权限 控制 、 快 速 的 元 数据 管理 并 共享 和 
利用 的 信息 资产 。 内 容 也 称 为 数字 内 容 ， 一 般 被 定义 为 任何 人 在 每 天 的 商业 和 个 
人 生活 中 都 会 使 用 到 的 电子 信息 。 它 包括 以 数字 方式 展现 的 文档 、 出 版 物 、 图 
像 、 视 频 、 音 频 、 软 件 、 表 格 、 收 据 、 票 据 、 设 计 、 合 同 以 及 电子 邮件 。 

内 容 管理 就 是 对 内 容 的 管理 ， 也 就 是 对 承载 内 容 的 形式 载体 的 管理 ， 就 是 要 
将 不 同类 型 的 数字 内 容 全 部 以 数字 化 的 方式 妥善 保存 起 来 ， 并 利用 高 效 的 查询 手 
段 对 所 保存 的 数字 资产 进行 查询 和 检索 ， 用 智能 分 析 技 术 对 其 进行 数据 挖掘 ， 最 
终 使 得 这 些 数字 内 容 能 够 得 到 最 充分 的 利用 ， 价 值 不 断 地 提升 ， 从 而 提高 企业 在 
言 息 时 代 的 竞争 力 。 

内 容 管 理 的 有 效 性 将 直接 使 得 内 容 分 发 更 有 效 和 容易 实现 ， 内 容 管 理 系统 强 
劲 的 检索 能 力 、 安 全 性 能 、 工 作 流 支持 、 全 方位 发 布 方式 将 使 得 系统 能 在 合适 的 
时 间 将 合适 的 内 容 分 发 到 合适 的 人 手中 ， 从 而 真正 发 挥 这 些 内 容 的 价值 。 同 时 ， 
内 容 发 布 产生 的 结果 将 直接 影响 到 内 容 创建 和 内 容 管理 系统 的 建设 ， 对 这 两 个 系 
统 提出 更 新 更 高 的 要 求 。 


1.3.2 内 容 管理 的 重要 性 


在 当今 信息 爆炸 的 时 代 ， 信 息 每 天 都 在 以 惊人 的 速度 增长 。 有 统计 表明 ， 来 
自 交 易 中 的 数据 每 年 增长 的 速度 达到 61% ， 而 其 他 各 种 相关 信息 的 年 增长 率 其 
至 超过 92% 。 同 时 ,信息 的 种 类 也 在 不 断 地 扩展 ， 越 来 越 多 非 结构 化 信息 不 断 
出 现 ， 包括 企业 的 各 种 报表 、 账 单 、 电 子 文档 、 网 站 的 各 种 元 素 、 图 片 、 传 真 、 
扫描 影像 ， 以 及 大 量 的 多 媒体 的 音频 、 视 频 信 息 等 。 而 信息 爆炸 的 背后 ， 面 临 的 
巨大 挑战 是 如 何 有 序 地 存储 、 管 理 并 利用 这 些 信息 ， 尤 其 是 对 于 那些 大 量 的 、 非 
结构 化 的 信息 。 如 果 一 个 企业 无 法 将 这 些 信息 进行 有 系统 地 分 类 编目 和 管理 ， 则 
随 之 面临 的 危机 是 不 断 流失 的 生产 力 。 男 一 方面 ， 企 业 和 组 织 也 希望 对 这 些 信息 
有 更 多 的 控制 ， 保 障 信息 的 安全 ， 挖 掘 信息 的 价值 。 因 而 ， 信 息 激 增 催 生 了 内 容 
管理 。 


1) 知识 经 济 浪 潮 的 来 临 ， 人 们 越 来 越 认 识 到 信息 和 知识 对 于 企业 的 巨大 价 
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值 。 但是, 分散、 混乱 的 数据 和 信息 形成 不 了 苋 争 力 ， 必 须 将 之 整合 成 为 有 组 织 
的 内 容 才能 充分 发 挥 价 值 。 在 许多 知识 管理 项 目 中 ， 投 资 最 大 的 部 分 不 是 技术 ， 
而 是 知识 库 的 内 容 。1997 年 ， 布 效 . 爱 伦 : 汉 密 顿 咨询 公司 用 于 知识 管理 项 目 
技术 方面 的 开支 为 25 万 美元 ， 而 用 于 内 容 管理 的 开支 〈 尚 不 包括 创造 内 容 的 开 
支 在 内 ) 高 达 75 万 美元 ， 远 远 超 过 技术 开 文 。 因 此 ， 内 容 管理 的 确 是 一 个 代价 
高 昂 的 项 目 ， 需 要 大 量 的 资金 投入 。 

2) 业务 应 用 对 内 容 管理 提出 了 迫切 需求 。 目 前 人 们 对 协同 商务 谈 得 很 多 ， 
它 包 括 企 业内 部 门 与 部 门 之 间 ， 企 业 与 外 部 企业 之 间 ， 企 业 与 供应 商 、 合 作 伙 
伴 、 分 销 商 、 服 务 提 供 商 、 客 户 等 的 业务 往来 。 内 容 管理 对 企业 内 部 而 言 ， 能 
很 好 地 做 到 信息 的 有 效 共享 及 信息 的 增值 利用 ， 对 于 外 部 来 讲 也 是 形成 真正 协同 
商务 的 组 成 部 分 。 有 效 的 内 容 管理 可 以 使 企业 的 供应 链 、 制 造 、 采 购 系 统 更 为 畅 
通 ， 保 证 企业 在 最 短 的 时 间 里 将 正确 的 产品 和 服务 传递 给 客户 ， 使 企业 的 商业 流 
程 自 动 化 ， 并 连接 其 供应 商 和 事业 伙伴 ， 获 取 并 分 析 客 户 、 供 应 商 、 雇 员 以 及 合 
作 伙伴 的 相关 信息 ， 并 通过 共享 内 容 管理 系统 来 帮助 企业 做 出 更 好 的 商业 决策 。 
可 以 说 ， 有 效 的 内 容 管理 是 实现 良好 的 整合 关系 管理 的 重要 保证 。 

3) 时 间 竞 争 也 需要 内 容 管理 。 知 识 不 仅仅 等 于 财富 ， 知 识 最 少 等 于 财富 的 
二 次 方 ， 这 句 话 同样 适用 于 内 容 ， 时 间 将 成 为 下 一 个 苋 争 优势 的 来 源 ; 而 为 了 能 
人 够 快速 有 效 地 响应 客户 ， 内 容 管理 也 是 必 不 可 少 的 ， 比 如 在 CRM (客户 关系 管 
理 ) 中 ,客户 内 容 管理 ， 包 括 合 同 管理 就 是 非常 重要 的 组 成 部 分 。 


1.3.3 内容 管理 的 建设 方法 


关于 内 容 的 管理 ， 除 了 前 面 提 到 与 内 容 相 关 的 各 种 管理 ， 近 年 来 ， 还 出 现 了 
M 字 头 的 管理 概念 与 系统 ， 像 客户 关系 管理 (CRM) 、 供 应 链 管理 (SCM) 、 人 
力 资 源 管理 (HRM) 以 及 虽 没有 M 但 归 在 此 类 的 企业 资源 计划 (ERP) 和 企业 
网 络 入 口 (EIP)。 这 么 多 的 管理 ， 所 产生 的 信息 与 数据 ， 自 然 更 要 纳入 企业 
“内 容 ” 的 体系 了 。 所 以 ,企业 的 “内 容 ” 范 围 越 来 越 大 。 但 这 么 多 名 词 、 概 念 
与 系统 ， 不 但 企业 用 户 和 弄 不 清楚 哪 一 个 做 什么 事 、 与 别 的 系统 有 什么 关联 ， 就 连 
资深 的 从 业者 ， 也 未 必 区 分 得 清楚 ， 而 且 系 统 越 发 展 越 有 重 苹 走势 。 每 类 系统 涵 
盖 的 范围 无 法 明确 ， 都 打算 以 高 投入 构建 一 个 适用 全 企业 的 大 系统 。 但 经 验 告诉 
我 们 ， 这 样 的 系统 太 昂 贵 、 发 展 太 耗 时 ， 尤 其 是 构建 集中 式 大 型 数据 库 ， 增 加 了 
系统 的 复杂 程度 ， 而 且 风 险 也 在 提高 。 

让 我 们 从 另外 一 个 角度 来 思考 ， 如 果 制 作 一 个 新 的 系统 ， 把 上 述 提 到 的 那些 
M 放 进 去 ， 则 多 半 是 由 上 而 下 的 结构 ， 也 就 是 把 下 层 原 来 运行 的 系统 、 原 来 分 
散在 各 处 各 种 格式 的 数据 ， 移 植 到 上 层 ， 建 立 一 个 庞大 的 系统 ， 形 成 一 个 庞大 的 
集中 式 数 据 和 内 容 存储 库 ， 这 样 ， 好 处 显而易见 ， 但 工程 浩大 也 在 意料 之 中 。 
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另 一 个 创新 的 构思 正好 相反 ， 是 从 下 而 上 ， 下 层 的 原 有 运行 的 系统 与 数据 ， 
不 论 分 散在 什么 地 方 、 也 不 论 什 么 格式 ， 都 可 以 维持 不 动 、 继 续 运 行 。 然 后 用 转 
换 的 方式 ， 把 数据 转换 成 中 性 如 XML 的 格式 ， 作 为 与 别 的 系统 衔接 沟通 的 共同 
语言 ， 再 由 一 个 信道 把 这 些 系统 串联 起 来 。 这 种 模式 的 建立 ， 是 把 现 有 各 个 底层 
的 数据 和 内 容 ， 建 立 一 个 共同 的 目录 控 管 机 制 ， 各 个 系统 处 理 数 据 和 内 容 的 软 
件 ， 都 依 此 目录 配送 ， 使 内 容 流 动 横 跨 各 系统 ， 既 不 必 制 造 一 个 集中 的 庞大 内 容 
库 ， 也 不 必 更 改 现 有 系统 的 运行 ， 自然 较 传统 的 做 法 省 时 省 钱 ， 风 险 也 大 为 
降低 。 

内 容 管理 的 顺畅 ， 有 赖 于 内 容 的 结构 化 ， 因 为 只 有 结构 化 ， 才 能 对 内 容 分 
类 、 索 引 、 排 序 、 搜 寻 。 利 用 XML 相关 工具 ， 来 制作 结构 化 的 内 容 ， 正 是 内 容 
管理 的 基础 建设 。 这 项 基础 建设 ， 无 疑 是 内 容 管 理 的 重要 程序 ， 也 是 一 项 十 分 艰 
苦 的 工作 ， 更 是 实施 企业 所 需要 付出 的 代价 。 


1.3.4 ”内容 管理 的 发 展 趋 势 


内 容 管理 发 展 到 今天 ， 时 间 并 不 长 ， 其 价值 也 未 被 充分 挖掘 ， 还 具有 很 大 的 
发 展 潜力 。 英 国 Ovum 咨询 公司 把 内 容 管理 分 为 工具 和 服务 两 个 领域 ， 认 为 到 
2012 年 内 容 管 理工 具 和 服务 的 市 场 规模 将 发 展 到 105 亿美 元 和 200 亿美 元 。 目 
前 CM 软件 市 场 主要 有 两 类 产品 ， 一 类 产品 功能 比较 丰富 ， 主 要 面向 企业 级 用 
户 ， 如 微软 SharePoint 、IBM FileNet、EMC Documentum 等 公司 提供 的 通用 平台 
性 解决 方案 ; 另 一 类 是 内 容 管理 的 专项 技术 提供 商 ， 如 Verity 提供 知识 检索 ， 
Micromedia 提供 内 容 创作 平台 等 。 

从 技术 和 应 用 角度 来 看 内 容 管理 的 未 来 发 展 ， 可 能 会 有 以 下 几 个 趋势 : 一 是 
应 用 范围 的 继续 折 展 ; 二 是 与 业务 应 用 更 加 紧密 结合 ， 应 用 集成 将 成 为 内 容 管理 
解决 方案 所 必须 要 考虑 的 问题 ; 三 是 技术 应 用 的 进一步 深化 ; 四 是 与 知识 管理 趋 
向 融合 ， 并 最 终 成 为 知识 管理 解决 方案 的 组 成 部 分 。 

1) 内 容 管理 应 用 范围 的 拓展 ， 主 要 表现 为 两 种 方向 的 “E”-CM。 第 一 个 
“ 玉 ” 是 Enterprise， 是 指 内 容 管 理 将 从 办 公 自 动 化 以 及 某 些 局 部 应 用 拓展 到 整个 
企业 ， 形 成 企业 内 容 管 理 。Gartner Group 在 2001 年 给 出 了 企业 内 容 管 理 的 定义 ， 
将 它 定位 为 “运用 技术 对 贯穿 企业 的 内 容 进 行 创建 、 捕 获 、 分 发 、 客 户 化 以 及 
管理 的 过 程 ”。 第 二 个 “E” 是 玉 -business ， 如 果 说 企业 内 容 管 理 主要 强调 对 企 
业内 部 管理 ， 而 E-business 的 内 容 管理 主要 强调 电子 商务 交易 中 对 整个 内 容 价 
值 链 的 管理 ， 使 企业 能 够 与 供应 商 、 合 作 伙伴 、 客 户 之 间 能 够 实现 充分 的 内 容 
共 侍 。 

2) 与 业务 应 用 的 结合 也 是 内 容 管理 发 展 的 必然 趋势 ， 因 为 内 容 管理 最 终 还 
是 要 服务 于 具体 的 业务 过 程 。 这 很 大 程度 上 是 一 个 系统 和 应 用 的 集成 问题 ， 它 需 





























" 14 . 企业 内 容 管理 理论 与 实践 





要 消除 应 用 (如 ERP、SCM、CRM 等 ) 之 间 妨 碍 内 容 应 用 的 界限 ， 使 企业 能 
充分 感知 市 场 和 用 户 的 需求 并 做 出 快速 响应 。 如 在 微软 的 Content Management 
Server 2001 和 CRM 的 集成 方案 中 ， 客 户 使 用 Web 站 点 输入 个 人 特征 信息 ， 这 些 
音 息 存储 到 CRM 中 ， 而 Content Management Server 2001 访问 这 些 数据 并 根据 客 
户 特 征管 理 客户 访问 到 的 内 容 ， 如 果 客 户 特征 发 生变 化 ， 提 交 给 客户 的 内 容 也 自 
动 变化 。 

3) 内 容 管 理 中 技术 应 用 的 深化 主要 表现 为 更 多 智能 手段 的 引入 ， 目 前 的 内 
容 管理 解决 方案 具备 了 检索 、 工 作 流 、 版 本 控制 等 基本 功能 ， 处 理 的 智能 性 还 不 
高 ; 文档 自动 分 类 技术 、 文 本 挖掘 、Web 挖掘 、Portal 等 技术 也 有 了 一 定 的 应 
用 ， 但 必定 还 会 发 展 出 更 智能 化 的 内 容 处 理 技术 ， 如 语义 分 析 、 自 然 语言 理解 、 
智能 代理 等 。 

4) 内 容 管 理 将 逐渐 与 知识 管理 趋 于 融合 ， 这 主要 是 归 因 于 内 容 管 理 的 很 多 
功能 与 知识 管理 相 比 并 不 具备 独特 性 。 而 且 在 目前 内 容 管理 和 知识 管理 各 自 的 应 
用 中 ， 也 没有 显示 出 太 多 的 差异 性 ， 这 其 中 一 个 原因 是 因为 知识 管理 尚 处 于 初级 
阶段 ,更 多 强调 的 恰恰 是 内 容 管 理 的 功能 。 随 着 知识 管理 应 用 的 深化 ， 很 多 内 容 
管理 解决 方案 提供 商 可 能 会 将 其 标签 改 为 “知识 管理 ”。 


1.4 内容 管理 的 关键 技术 


内 容 管理 是 针对 实际 问题 提出 的 解决 方案 ， 是 人 、 过 程 与 技术 的 集成 ， 需 要 
从 人 员 组 织 、 业 务 流 程 以 及 内 容 管理 系统 的 建立 等 多 方面 共同 协调 实现 ， 涉 及 的 
应 用 范围 较 广 。 有 关内 容 管理 的 研究 可 以 分 为 四 个 主要 研究 方向 : 功能 研究 、 特 
定 应 用 领域 的 研究 、 内 容 管理 技术 研究 以 及 内 容 管理 和 其 他 应 用 的 集成 研究 。 

内 容 管理 关键 技术 的 研究 侧重 于 支撑 内 容 管理 平台 的 核心 技术 研究 ， 主 要 包 
括 XML 和 元 数据 技术 、 内 容 仓库 技术 、 内 容 访问 技术 、 工 作 流 技术 、 应 用 集成 
技术 以 及 数据 检索 和 挖掘 技术 。 


1. 4.1 XML 和 元 数据 


XML 技术 是 目前 公认 的 对 内 容 管 理 影响 最 大 ， 贯 穿 其 整个 生命 周期 的 技术 。 
内 容 管理 三 商 基 本 上 都 将 结构 简单 、 易 于 理解 的 XML 结构 作为 动态 内 容 管理 的 
组 织 结构 。XML 可 以 很 方便 地 将 内 容 从 企业 规则 和 表达 中 分 离 出 来 。XML 标记 
的 文档 可 以 使 用 户 更 方便 地 提取 和 重用 自己 想 用 的 内 容 ， 并 使 用 自己 喜欢 的 表达 
格式 ， 这 为 客户 提供 了 一 个 很 好 的 按 需 定制 的 特性 ， 具 有 非常 好 的 灵活 性 。 通 过 
XML 还 可 以 使 内 容 脱离 格式 ， 成 为 只 与 上 下 文 相关 的 数据 ， 以 便于 内 容 的 检索 、 
合并 或 者 重用 ， 满 足 了 跨 媒 体 出 版 的 需求 。 一 个 基于 XML 的 通用 存储 方式 ， 还 
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可 以 帮助 企业 管理 和 维护 大 量 的 不 同 内 容 。 

元 数据 是 关于 数据 的 数据 ， 是 以 计算 机 系统 能 够 使 用 与 处 理 的 格式 存在 的 ， 
与 内 容 相 关 的 数据 ， 它 是 对 内 容 的 一 种 描述 方式 。 通 过 这 种 方式 ， 可 以 表示 内 容 
的 属性 与 结构 信息 。 元 数据 分 为 描述 元 数据 、 语 义 元 数据 、 控 制 元 数据 和 结构 元 
数据 。 在 内 容 管 理 中 ， 经 常 是 元 数据 越 复杂 ， 内 容 提 升 价值 的 潜力 就 越 大 。 丰 富 
的 元 数据 模型 不 是 一 践 而 就 的 ， 需 要 一 个 面向 客户 内 容 管理 的 通用 数据 模型 ， 灵 
活 扩展 以 适应 客户 不 断 变 化 的 需求 ， 达 到 提升 信息 价值 的 目的 。 元 数据 一 旦 从 原 
始 内 容 中 提取 出 来 ， 就 可 以 把 它 与 原始 的 内 容 分 开 ， 单 独 对 它 进 行 处 理 ， 从 而 大 
大 简化 了 对 内 容 的 操作 过 程 。 另 外 ， 语 义 元 数据 与 结构 元 数据 还 可 用 于 内 容 的 检 
索 和 挖掘 。 

目前 XML 和 元 数据 主要 用 于 内 容 管理 中 数据 存储 及 其 结构 设计 、 应 用 之 间 
的 数据 交换 格式 和 标准 化 设计 等 方面 。 


1.4.2 内 容 仓库 技术 


在 内 容 管理 这 个 新 兴 和 不 成 熟 的 市 场 中 ， 大 量 的 厂商 按照 自己 的 理解 提出 多 
种 多 样 的 产品 理念 、 体 系 架 构 、 功 能 性 ， 拥 有 自己 的 私有 内 容 仓库 引擎 ， 导 致 当 
前 的 内 容 管理 系统 缺乏 统一 标准 且 交 互 和 维护 困难 。 随 着 内 容 管理 应 用 程序 的 日 
益 普 及 ， 遵 循 内 容 仓库 标准 、 提 供 标准 化 API (应 用 程序 编程 接口 ) 的 内 容 仓库 
系统 的 需求 已 凸现 出 来 。2005 年 ，Java 联盟 机 构 首 次 提出 了 Java 内 容 仓库 
(Java Content Repository ，JCR) 规范 标准 ，JCR1.0 标准 具体 由 JSR-170 指定 ， 
2009 年 10 月 ,由 JSR-283 指定 的 JCR2. 0 标准 定稿 。 

JCR 标准 打破 了 传统 ECM 领域 技术 上 的 分 立 局 面 ， 提 供 了 一 套 Java 平台 上 
的 标准 内 容 仓库 API 规范 ， 此 规范 定义 树 状 节点 模型 存储 内 容 数据 ， 并 提出 基于 
此 模型 的 诸如 访问 粒度 控制 、 版 本 控制 、 内 容 事件 、 全 文 检 索 和 过 滤 等 服务 功 
能 。 它 抽象 了 应 用 程序 对 内 容 仓库 访问 的 细节 ， 人 允许 人 们 以 供应 商 中 立 的 方式 访 
问 任何 兼容 JSR-170/283 规范 的 仓库 实现 。 


1.4.3 内容 访问 技术 


企业 内 容 管理 系统 的 一 个 很 重要 的 功能 是 要 满足 企业 内 部 、 企 业 外 部 用 户 的 
合理 有 效 访 问 。 通 过 FIP、CIFS、WebDAV、Web Services 以 及 CMIS 技术 ， 可 以 
最 大 程度 地 满足 用 户 的 内 容 访问 需求 。 

FTP (文件 传输 协议 ) 是 传统 的 基于 TCP/IP 的 文件 传输 协议 ， 目 标 是 提高 
文件 的 共享 性 ， 提 供 非 直接 使 用 远程 计算 机 ， 使 存储 介质 对 用 户 透 明和 可 靠 高 效 
地 传送 数据 。 虽 然 可 以 手工 使 用 它 ， 但 是 它 的 主要 作用 是 供 程序 使 用 的 。 

CIFS (Common Internet File System ， 通 用 Internet 文件 系统 ) 是 一 个 新 提出 
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的 协议 ， 它 使 程序 可 以 访问 远程 Internet 计算 机 上 的 文件 并 要 求 此 计算 机 的 服 
务 。CIFS 使 用 客户 /服务 器 模式 ， 客 户 程序 请 求 远 在 服务 器 上 的 服务 器 程序 为 它 
提供 服务 ， 服 务 器 获得 请 求 并 返回 响应 。CIFS 是 公共 的 或 开放 的 SMB (服务 器 
言 息 块 协议 版 本 ， 并 由 微软 使 用 。SMB 协议 现在 是 局 域 网 上 用 于 服务 器 文件 
访问 和 打印 的 协议 。 像 SMB 协议 一 样 ，CIFS 在 高 层 运行 ， 而 不 像 TCP/IP 那样 
运行 在 底层 。CIFS 可 以 看 做 是 应 用 程序 协议 如 文件 传输 协议 和 超 文 本 传输 协议 
的 一 个 实现 。 它 可 以 实现 内 容 仓库 和 本 地 文件 系统 之 间 的 直接 映射 ， 在 Windows 
主机 之 间 进 行 网 络 文件 共享 。 

基于 RFC Internet 的 文档 管理 规范 WebDAV (Web Distributed Authoring and 
Versioning，Web 分 布 式 创 作 和 版 本 管理 ) 协议 ， 作 为 一 种 分 布 式 的 通信 标准 ， 
采用 WebDAV 协议 可 以 进行 文件 发 布 、 文 件 共 享 和 协同 工作 ， 它 可 以 很 好 地 穿 
过 防火 墙 工作 。 该 规范 为 进行 分 布 式 企 业内 容 管理 提供 了 强 有 力 的 支持 。 

关于 Web services 和 CMIS 技术 的 前 述 ， 将 在 第 四 章 详细 介绍 。 


1.4.4 工作 流 技术 


随 着 内 容 管理 走向 企业 应 用 前 台 ， 与 企业 业务 流程 和 工作 环境 的 结合 日 益 紧 
密 ， 内 容 工 作 流 和 内 容 协作 支撑 技术 的 核心 作用 开始 凸现 出 来 。 虽 然 内 容 存 储 、 
检索 和 分 析 方 面 的 需求 作为 企业 信息 基础 应 用 相对 稳定 。 但 内 容 采 集 、 加 工 、 发 
布 和 服务 等 内 容 应 用 却 常常 要 发 生变 化 ， 内 容 管理 需要 做 到 随 需 应 变 ， 以 提高 内 
容 在 企业 业务 流程 中 的 流转 效率 。 

为 了 让 内 容 能 够 及 时 、 准 确 地 自动 传递 到 相关 人 员 手 中 ， 内 容 管理 流程 需要 
符合 企业 的 业务 流程 。 高 效 灵活 、 易 管理 、 易 扩展 的 内 容 工作 流 技 术 和 丰富 、 开 
放 、 跨 平台 的 内 容 协 作 支 持 是 内 容 管理 融入 企业 商务 主流 应 用 的 重要 保证 。 

工作 流 技术 是 内 容 管理 的 关键 技术 之 一 ， 一 方面 ， 它 可 以 连接 内 容 管理 系统 
中 的 各 个 功能 或 业务 活动 ,构建 灵活 、 规 范 、 统 一 的 内 容 管理 流程 ; 另 一 方面 ， 
部 分 内 容 管理 工作 流 可 以 作为 内 容 管理 平台 与 其 他 企业 应 用 之 间 的 桥梁 ， 为 应 用 
集成 和 过 程 集成 提供 支持 。 内 容 管理 中 的 工作 流 技 术 主 要 分 为 内 山 式 工作 流 和 独 
立 的 工作 流 系统 两 种 ， 其 中 内 内 式 工作 流 主要 用 于 内 容 管理 平台 内 部 流 的 管理 ， 
而 独立 的 工作 流 系统 更 适 于 为 内 容 管 理 平台 和 其 他 应 用 的 交互 提供 支持 。 

业务 流程 管理 (Business Process Management，BPM) 与 面向 服务 架构 
(Service Oriented Architecture ，SOA) 各 自 历经 多 年 的 发 展 ， 越 来 越 成 为 人 们 关 
注 的 焦点 。BPM 的 范围 覆盖 了 企业 运营 的 各 个 环节 ， 如 和 生产、 销售 、 物 流 、 
财务 等 企业 经 营 活动 ， 甚 至 延伸 到 供应 商 和 经 销 商 。 目 前 ， 工 作 流 技术 已 广泛 
应 用 在 内 容 管理 的 各 个 应 用 领域 ， 如 政府 办 公 、 审 批 流程 、 企 业内 容 管理 流 


程 等 。 















































第 工 章 ”内容 和 内 容 管理 “17 ， 





1.4.5 应 用 集成 技术 


从 信息 系统 功能 的 角度 看 ， 内 容 管理 就 是 对 其 包含 的 数据 和 元 数据 在 整个 生 
命 周期 (采集 、 加 工 、 存 储 、 传 输 、 发 布 ) 中 的 管理 ， 目 的 就 是 使 信息 能 够 更 
快速 、 无 颖 地 集成 到 企业 的 信息 基础 设施 中 来 ， 这 就 要 求 内 容 管理 产品 平台 能 够 
很 好 地 与 企业 已 有 的 应 用 系统 进行 交互 ， 如 ERP、CRM 等 应 用 系统 ， 并 能 处 理 
来 自 这 些 应 用 的 数据 。 因 此 ， 应 用 集成 技术 也 是 内 容 管理 研究 中 的 关键 技术 
Se 

目前 ， 应 用 集成 研究 主要 分 为 用 户 界 面 集 成 、 数 据 集 成 、 功 能 集成 三 种 类 
型 。 其 中 功能 集成 还 可 以 分 为 业务 流程 集成 以 及 函数 /方法 集成 两 种 类 型 。 每 类 
集成 方式 都 有 各 自 的 方法 研究 、 集 成 技术 研究 以 及 功能 和 性 能 评价 的 相关 研究 
等 。 在 内 容 管 理 中 ， 应 用 集成 主要 体现 在 单 点 登录 、 统 一 用 户 认证 、 内 容 管理 和 
工作 流 管理 集成 等 方面 。 

内 容 管理 应 用 集成 既 要 体现 平台 所 有 的 功能 ， 又 要 尽量 遵循 标准 ， 只 有 遵循 
业界 标准 ， 才 能 保证 开发 人 员 容 易 开 发 ， 应 用 容易 移植 。 

应 用 集成 还 涉及 海量 信息 存储 技术 ， 主 要 包括 海量 信息 存储 模型 研究 ， 包 括 
分 级 存储 管理 ( Hierarchical Storage Management，HSM) 存储 架构 、 分 布 式 存储 
架构 、 信 息 归档 、 信 息 备份 、 内 容 分 发 网 络 等 技术 ; 跨 媒体 信息 发 布 技术 ， 主 要 
包括 内 容 面向 不 同 媒体 介质 的 发 布 技术 ， 如 Web 发 布 技术 、 数 据 库 出 版 技术 、 
光盘 出 版 技术 等 。 


1.4.6 数据 检索 和 挖掘 技术 


数据 检索 技术 也 是 内 容 管 理 系 统 的 关键 技术 之 一 ， 该 技术 用 来 帮助 使 用 者 快 
速 定位 所 需 内 容 。 按 照 搜索 方法 可 分 为 全 文 搜索 、 上 下 文 搜索 等 。 

目前 ， 内 容 检索 技术 正 向 异 构 内 容 信息 源 整合 检索 方向 发 展 。 随 着 人 们 对 信 
息 获 取 和 利用 上 的 认识 不 断 加 深 ， 加 之 路 组 织 流 程 再 造 、 内 部 知识 资源 整合 、 供 
应 链 管理 、 客 户 关 系 管理 、 电 子 商 务 等 概念 不 断 冲 击 着 企业 经 营 者 ， 有 关 企 业内 
部 和 外 部 多 种 信息 资源 的 整合 变 得 比 以 往 更 重要 ， 也 更 紧迫 。 由 于 这 些 信息 来 源 
不 同 ， 存 储 格式 和 系统 不 同 ， 访 问 和 检索 方式 也 不 同 ， 因 而 出 现 异 构 资源 整合 检 
索 的 问题 ， 用 户 需 要 统一 对 这 些 内 容 进行 访问 和 检索 。 面 对 海量 的 内 容 数 据 和 并 
发 检索 压力 ， 要 保证 检索 性 能 ， 就 需要 将 分 布 群集 检索 、 高 速 缓存 和 负载 均衡 这 
些 技术 都 结合 到 检索 中 来 。 目 前 ， 内 容 管理 中 的 检索 技术 正 向 多样 化 、 智 能 化 发 
展 。 其 中 包括 智能 化 知识 检索 技术 、 自 然 语 言 查询 、 多 媒体 信息 检索 技术 等 。 

内 容 管理 中 为 一 个 关键 技术 是 内 容 挖 气 和 智能 关联 技术 。 分 类 、 摘 要 、 标 
引 、 聚 类 、 相 关 分 析 等 自然 语言 处 理 技术 将 被 越 来 越 多 地 应 用 于 内 容 分 析 和 内 容 
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服务 。 

内 容 管 理 是 一 个 集 人 、 过 程 与 技术 于 一 体 的 工程 。 它 不 是 简单 的 功能 堆砌 ， 
而 是 需要 将 上 述 各 功能 和 技术 有 机 地 集成 在 一 起 ， 让 不 同 部 门 、 不 同 需求 的 人 都 
能 使 用 ， 以 实现 真正 有 效率 的 内 容 管理 服务 。 


1.5 内 容 管 理 的 应 用 








内 容 管理 目前 广泛 应 用 于 网 站 、 金 融 、 保 险 、 出 版 、 医 疗 以 及 各 种 信息 密集 
型 的 企 事 业 单 位 。 根 据 不 同行 业 的 任务 要 求 ， 内 容 管理 也 划分 成 了 网 站 内 容 管 
理 、 企 业内 容 管理 、 出 版 内 容 管 理 等。 同时 ， 内 容 管理 还 广泛 应 用 于 数字 资产 管 
理 (Digital Asset Management，DAM ) 、 电子 政务 、 数 字 图 书馆 、 企 业 信 息 门 户 等 
领域 。 


1.5.1 网 站 内 容 管 理 


网 站 内 容 管理 也 称 为 Web 内 容 管理 (Web Content Management，WCM) ， 是 
内 容 管理 的 一 个 分 文 。 随 着 互联 网 的 进一步 发 展 ， 大 量 的 信息 以 Web 网 页 及 相 
关 Web 形式 表现 ， 企 业 无 论 是 获取 还 是 发 布 内 容 ，Web 均 已 成 为 主要 的 必 备 手 
段 。 同 时 ， 越 来 越 多 的 消费 者 习惯 于 利用 Web 获取 、 发 布 和 交流 信息 。 

WCM 主要 针对 互联 网 信息 管理 平台 实施 管理 ， 对 采集 到 的 内 容 进行 管理 并 
最 终 出 版 到 网 站 上 ， 包 括 Intermet、Intranet 和 Extranet。 它 的 重点 是 格式 模板 和 
布局 的 设计 、 版 本 控制 、 内 容 的 安全 和 审核 。 网 站 内 容 管理 不 同 于 网 站 管理 ， 网 
站 管理 的 重点 是 网 页 的 导航 、 性 能 、 可 获得 性 以 及 站 点 的 安全 。 网 站 内 容 管理 不 
仅 能 让 企业 控制 所 有 内 容 ， 还 应 该 能 将 动态 、 个 性 化 的 内 容 按照 企业 的 业务 要 求 
提供 给 最 终 用 户 ， 以 实现 企业 经 营 的 目标 。 

电子 商务 取得 实质 性 快速 进展 ， 无 论 是 B2B、B2C 或 是 C2C， 企业 需 要 将 更 
丰富 和 细致 的 商务 内 容 提供 给 消费 者 、 提 供 商 、 供 应 商 、 增 值 商 和 合作 伙伴 。 而 
Web 已 被 公认 为 广泛 接受 的 、 标 准 的 和 有 效 的 信息 互联 平台 。 对 Web 内 容 管理 
的 持续 投入 符合 商业 创新 和 业务 整合 的 要 求 。 


1.5.2 媒体 内 容 管理 


媒体 内 容 管理 关注 媒体 公司 内 部 的 媒体 资产 的 有 效 管理 。 随 着 媒体 、 平 台 和 
文档 格式 的 不 断 增 加 ， 对 媒体 公司 〈 内 容 提供 者 ) 和 信息 基础 设施 有 很 大 的 影 
响 。 即 使 传统 的 小 杂志 企业 也 会 在 新 的 电子 媒体 上 找到 新 的 机 会 和 需求 。 灵 活 的 
内 容 管理 基础 设施 可 以 提供 跨 媒体 的 出 版 方法 ， 以 满足 不 同 用 户 的 要 求 ， 而 不 仅 
仅 是 为 了 单一 渠道 的 出 版 而 优化 出 版 技术 。 
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1.5.3 企业 内 容 管理 


企业 内 容 管理 (Enterprise Content Management，ECM) 是 企业 面向 客户 的 应 
用 与 内 部 处 理 过 程 之 间 的 重要 连接 ， 是 内 容 管 理 的 一 个 重要 分 文 。 在 组 织 内 部 ， 
由 于 互联 网 普及 而 带 来 的 用 户 行为 习惯 和 IT 架构 模式 的 变化 ， 集 成 内 部 内 容 的 
管理 越 来 越 重要 ，ECM 主要 针对 企业 内 部 ， 可 架构 在 企业 内 部 门户 平台 之 上 ， 
对 企业 内 部 文档 、 知 识 实施 全 面 管 理 ， 关 于 ECM 的 内 容 ， 将 在 第 2 章 中 详细 


介绍 。 


ECM 结合 了 相关 技术 ， 使 企业 将 文档 、 记 录 与 片断 以 及 更 加 多 样 的 文档 格 
式 与 业务 过 程 相 连接 ， 从 而 管理 这 些 内 容 与 其 生命 周期 的 活动 。ECM 经 常 要 求 
无 颖 地 集成 企业 文档 和 知识 管理 ， 有 时 还 要 求 集成 网 站 内 容 管 理 的 功能 。 

从 发 展 趋势 看 ，ECM 中 的 功能 模块 很 多 会 体现 出 工具 化 和 组 件 化 的 特征 ， 
而 以 Web 内 容 管理 模式 作为 主要 的 整合 和 展现 的 应 用 框架 ， 形 成 完整 的 企业 内 
容 管理 架构 。 


1.5.4 金融 业内 容 管理 


随 着 金融 业 的 发 展 ， 银 行 信息 系统 的 建设 和 完善 ， 结 构 化 数据 的 存储 和 处 理 
通过 数据 库 技术 已 逐步 得 到 解决 ， 然 而 如 何 有 效 地 获取 、 管 理 非 结构 化 内 容 ， 并 
能 在 各 种 系统 中 有 效 地 利用 这 些 非 结构 化 内 容 ， 是 进一步 提高 金融 行业 信息 化 水 
平 的 主要 障碍 ， 金 融 业 内 容 管理 显得 日 益 重 要 。 

银行 日 常 单据 、 票 证 处 理 量 数 以 万 计 ， 男 外 还 有 信贷 业务 、 个 贷 业 务 、 国 际 
业务 、 信 用 卡 业务 等 的 业务 处 理 资料 ， 种 类 繁多 、 管 理 复杂 。 利 用 内 容 管 理解 决 
方案 ， 能 够 提供 统一 的 查询 、 访 问 接口 进行 访问 ， 即 用 户 在 提交 一 个 查询 请 求 后 
能 返回 所 有 符合 查询 条 件 的 信息 。 不 管 是 数据 还 是 内 容 ， 也 不 管 属于 何 种 类 型 的 
内 容 ， 都 大 大 提高 了 银行 内 部 管理 效率 ， 降 低 运 营 风险 。 

在 发 达 国 家 ， 人 金融 机 构 利用 内 容 管理 方案 搭建 统一 的 系统 平台 已 很 普遍 。 目 
前 ， 我 国 金融 服务 企业 的 最 紧迫 任务 是 : 迅速 更 新 金融 服务 理念 ， 建 设 跨 平 台 内 
容 基 础 ， 实 现 各 主要 业务 系统 的 互联 交换 和 资源 共享 ， 让 用 户 享受 到 便捷 周到 的 
服务 。 中 国 工商 银行 、 上 海 证 券 交 易 所 、 香 港汇 丰 银 行 、 香 港 漆 打 银 行 ， 都 已 利 
用 内 容 管理 解决 方案 ， 建 立 了 统一 的 综合 业务 平台 ， 以 全 新 的 状态 服务 着 各 地 的 
用 户 。 


1.5.5 电子 政务 中 的 内 容 管理 


按照 联合 国有 关 电子 政务 阶段 划分 标准 ， 各 国电 子 政务 发 展 程度 由 低 到 高 依 
次 为 起 步 、 信 息 单 向 发 布 、 双 向 互动 、 政 务实 时 处 理 和 一 站 式 服务 。 目 前 电子 政 
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务 水 平 较 发 达 的 美国 、 英 国 、 新 西 兰 等 国家 基本 能 够 达到 政务 实时 处 理 的 层次 。 
亚太 其 他 国家 和 地 区 的 政府 也 已 积极 采用 基于 互联 网 的 技术 发 展 自己 的 电子 政 
务 。 这 些 包括 通过 政府 门户 网 站 向 公众 提供 及 时 更 新 的 信息 ， 以 及 部 署 内 容 管理 
软件 解决 方案 ， 来 提高 效率 。 

电子 政务 所 包含 的 内 容 极为 广泛 ， 几 乎 可 以 包括 传统 政务 活动 的 各 个 方面 : 
政府 内 部 网 络 办 公 系 统 ， 电 子 法 规 、 政 策 系 统 ， 电 子 公文 系统 ， 电 子 司法 档案 系 
统 ， 电 子 财 政 管理 系统 ， 电 子 税务 系统 ， 综 合 信息 服务 系统 等 。 

电子 政务 内 容 管理 系统 将 政务 信息 进行 整合 ， 快 捷 、 智 能 并 且 完 美 地 体现 出 
最 生动 的 形象 ， 真 正 显示 其 电子 政务 数据 和 内 容 共 享 以 及 互联 互通 的 无 穷 魅 力 。 

与 电子 商务 类 似 ， 在 面向 服务 转型 和 信息 公开 的 推动 下 ， 政 府 发 现 通 过 构架 
在 Web 之 上 ， 电 子 政务 应 用 在 连通 社会 、 企 业 和 公众 方面 可 取得 较 好 的 效益 ， 
Web 内 容 管理 在 搭建 各 级 政务 门户 应 用 领域 将 获得 极 大 应 用 。 


1.5.6 保险 行业 中 的 内 容 管理 


内 容 管 理解 决 方案 在 全 球 著 名 保险 提供 商 中 的 应 用 更 是 普遍 。ACTA 挪威 公 
司 、AMP 澳大利亚 公司 、Aon 公司 、Avanturo 公司 、Connecticut 通用 人 寿 保 险 公 
司 、Jackson 国家 人 寿 保 险 公 司 、Minnesota 人 寿 保险 公司 等 全 球 多 家 保险 公司 ， 
应 用 内 容 管理 解决 方案 建立 统一 的 业务 平台 。 在 保险 行业 竞争 激烈 的 情况 下 ， 国 
内 保险 公司 都 在 不 断 推 出 多 元 化 的 保险 产品 及 理财 服务 ， 随 着 保险 公司 客服 系 
统 、 理 赔 系统 、 储 档 系 统 等 新 应 用 的 逐步 建立 ， 各 种 类 型 的 信息 总 量 也 成 倍增 
加 。 利 用 内 容 管理 解决 方案 建立 完整 高 效 的 综合 业务 管理 平台 ， 加 强 对 企业 信息 
内 容 的 管理 ， 正 成 为 国内 保险 行业 的 潮流 。 















































1.6 如 何 进行 内 容 管理 


综合 前 面 所 述 ， 内 容 管理 要 真正 发 挥 作 用 ， 并 不 单单 是 建立 一 个 技术 性 的 内 
容 管理 系统 就 能 解决 的 ， 它 是 一 项 结合 人 、 过 程 以 及 技术 的 “技术 -社会 ” 
工程 。 

1) 在 人 方面 ， 需 要 建立 专门 的 内 容 管理 机 制 ， 指 派 特 定 的 内 容 人 员 (如 内 
容 经 理 、 内 容 编辑 等 ) 进行 内 容 的 管理 和 维护 。 比 如 ， 某 企业 总 部 建立 了 一 整 
套 搜集 、 算 选 信息 的 网 络 和 机 构 ， 要 求 各 分 三 必须 将 当天 的 产量 、 质 量 和 员工 状 
况 等 情况 ， 于 下 午 4 点 前 报到 总 经 理 办 公 室 ; 120 个 营销 点 每 晚 9 点 前 也 要 将 政 
情 、 商 情 、 民 情 送 回 总 部 ， 由 办 公 室 将 这 两 方面 信息 加 上 从 文件 、 报 刊 等 渠道 获 
取 的 重要 信息 编 印 成 《快报 》 送 有 关 人 员 参 考 。 集 团 董事 会 每 月 召开 一 次 重大 
经 济 信 息 分 析 会 议 。 这 种 机 制 使 得 企业 能 眼 观 六 路 ， 耳 听 八 方 ， 耳 聪 目 明 ， 活力 
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四 射 。 

2) 在 过 程 方面 ， 要 建立 透明 的 内 容 管理 过 程 ， 包 括 内 容 的 创建 、 存 储 、 分 
享 、 应 用 和 更 新 ， 并 要 将 内 容 管理 过 程 和 具体 的 业务 过 程 紧密 结合 ， 使 内 容 
“从 业务 中 来 ， 并 到 业务 中 去 ”。 

3) 在 技术 方面 ， 主 要 就 是 要 建立 一 套 内 容 管理 系统 ， 为 内 容 人 员 以 及 内 容 
管理 过 程 提 供 技术 上 的 支撑 环境 。 智 达 内 容 管理 平台 就 是 一 套 拥 有 上 自主 核心 技术 
和 知识 产权 的 内 容 管理 产品 ， 实 现 了 内 容 采 集 、 创 建 、 传 递 和 内 容 分 析 的 内 容 产 
业 价 值 链 的 完全 整合 ， 为 电子 政务 、 企 业 信息 门户 和 知识 管理 系统 、 网 站 内 容 管 
理 和 数字 图 书馆 的 建设 提供 一 站 式 和 个 性 化 解决 方案 。 
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企业 内 容 管理 (Enterprise Content Management，ECM) 关注 于 企业 内 部 以 及 
企业 之 间 的 文本 和 多 媒体 内 容 的 管理 ， 是 近年 来 一 个 新 兴 的 信息 管理 学 研究 领 
域 。 企 业内 容 管理 系统 ( Enterprise Content Management System ，ECMS) 就 是 能 
够 支撑 企业 内 容 管理 的 一 种 工具 或 一 套 工 具 的 组 合 ， 企 业内 容 管理 系统 的 发 展 经 
历 了 集中 式 管理 、 分 散 式 管理 、 分 布 式 管理 ， 在 互联 网 应 用 日 趋 广泛 的 今天 ， 如 
何 基 于 Web 网 络 环境 ， 实 现 一 个 开放 、 标 准 化 、 统 一 的 企业 内 容 管理 系统 ， 已 
成 为 企业 内 容 管理 系统 研究 领域 的 一 个 重要 方向 。 

ECM 是 企业 面向 客户 的 应 用 与 内 部 处 理 过 程 之 间 的 重要 连接 ， 是 内 容 管理 
的 一 个 重要 分 文 。 在 组 织 内 部 ， 由 于 互联 网 普及 而 带 来 的 用 户 行为 习惯 和 了 T 染 
构 模 式 的 变化 ， 集 成 内 部 内 容 的 管理 越 来 越 重 要 ，ECM 主要 针对 企业 内 部 ， 可 
架构 在 企业 内 部 门户 平台 之 上 ， 对 企业 内 部 文档 、 知 识 实 施 全 面 管理 。 

ECM 结合 了 相关 技术 ， 使 企业 将 文档 、 记 录 与 片断 以 及 更 加 多 样 的 文档 格 
式 与 业务 过 程 相连 接 ， 从 而 管理 这 些 内 容 与 其 生命 周期 的 活动 。ECM 经 常 要 求 
无 颖 地 集成 企业 文档 和 知识 管理 ， 有 时 还 要 求 集成 网 站 内 容 管 理 的 功能 。 从 发 展 
趋势 看 ，ECM 中 的 功能 模块 很 多 会 体现 出 工具 化 和 组 件 化 的 特征 ， 而 以 Web 内 
容 管理 模式 作为 主要 的 整合 和 展现 的 应 用 框架 ， 形 成 完整 的 企业 内 容 管理 架构 。 






































2.1 企业 内 容 管理 的 简介 


2.1.1 企业 内 容 管理 的 定义 


随 着 IT 应 用 的 深入 普及 ， 各 行 各 业 都 积累 了 大 量 的 信息 资源 。 科 学 管理 和 
合理 开发 这 些 内 部 和 外 部 信息 资源 已 经 成 为 企业 正确 决策 、 增 强 竞 争 力 的 关键 。 
缺乏 有 效 管理 和 发 布 能 力 的 数字 内 容 会 浪费 企业 大 量 的 成 本 ,知识 型 雇员 会 把 时 
间 浪 费 在 寻找 和 获取 完成 他 们 的 工作 所 需要 的 信息 内 容 上 。 

在 一 些 诸如 电信 、 金 融 、 媒 体 等 以 内 容 为 其 主要 核心 业务 的 行业 中 ， 内 容 和 
应 用 程序 代码 已 成 为 关键 性 资产 。 因 此 ， 要 增强 自身 的 全 球 竞争 力 ， 就 必须 将 内 
容 转 化 为 推动 商业 成 功 的 资产 。 

与 此 同时 ， 所 有 行业 也 都 面临 着 管理 各 种 格式 的 信息 的 挑战 。 客 户 对 数据 管 
理 的 需求 已 经 超出 了 传统 数据 管理 的 概念 。 研 究 部 门 调查 发 现 ， 在 企业 存储 的 大 
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量 数据 中 ， 传 统 关 系数 据 库 管 理 系统 处 理 的 结构 化 数据 仅 占 数据 信息 总 量 的 
15% ， 而 在 企业 内 部 ,， 约 80% 以 上 的 信息 内 容 都 是 以 非 结构 化 形式 存在 的 ， 包 
括 纸 上 的 文件 、 报 告 、 视 频 和 音频 文件 、 照 片 、 传 真 件 、 信 件 等 。 这 些 非 结构 化 
内 容 ， 如 果 完 全 依靠 手工 进行 加 工整 理 、 分 类 ， 将 意味 着 需要 巨大 的 人 工 成 本 。 
如 何 管理 这 些 非 结构 化 信息 ， 成 为 传统 结构 化 数据 管理 的 一 大 难题 。 自 动 化 地 对 
这 些 内 容 做 全 面 的 管理 ， 是 企业 内 容 管理 系统 的 重要 任务 。 

企业 内 容 管理 正 是 随 着 数据 管理 的 发 展 而 为 客户 提供 的 一 种 应 用 软件 ， 它 管 
理 、 集 成 和 访问 从 音频 、 视 频 到 扫描 图 像 的 各 种 格式 的 商业 信息 。 内 容 管 理 处 理 
的 对 象 范围 比 传统 关系 数据 库 管 理 系统 处 理 的 结构 化 数据 更 广 ， 除 了 一 般 文字 、 
文档 、 多 媒体 、 流 媒体 外 ， 还 包括 Web 网 页 、 广 告 、 程 序 、 软 件 等 一 切 数字 资 
产 ， 即 所 有 结构 化 的 数据 和 非 结构 化 的 文档 。 内 容 管理 解决 方案 重点 解决 各 种 非 
结构 化 或 半 结 构 化 的 数字 资源 的 采集 、 管 理 、 利 用 、 传 递 和 增值 ， 并 集成 到 结构 
化 数据 的 信息 系统 中 ， 如 ERP、CRM 等 ， 从 而 为 这 些 应 用 系统 提供 更 加 广泛 的 
数据 来 源 。 

ECM 主要 针对 企业 内 部 ， 可 架构 在 企业 内 部 门户 平台 之 上 ， 对 企业 内 部 文 
档 、 知 识 实施 全 面 管理 。 企 业内 容 管理 的 作用 在 于 : 深入 挖掘 企业 内 、 外 部 资 
源 ， 把 企业 内 部 有 价值 的 数字 资源 收集 起 来 ， 进 行 加 工整 理 ， 让 需要 的 人 可 以 方 
便 地 找到 和 共享 这 些 资源 ， 资 源 得 到 充分 共享 ， 数 字 资 源 做 到 一 次 创建 、 重 复 使 
用 、 多 人 共享 ， 使 企业 的 运转 效率 得 到 提升 ， 高 效 的 内 容 定位 、 快 速 高 效 的 检索 
可 以 让 员工 快速 找到 与 本 职工 作 相关 的 知识 ， 节 约 寻 找 信 息 的 时 间 ， 提 高 工作 
效率 。 


2.1.2 企业 内 容 管理 的 功能 组 件 


国内 外 市 场 的 发 展 趋势 表明 ， 企 业内 容 管理 将 成 为 下 一 轮 软件 市 场 兖 争 的 热 
点 ， 处 于 不 断 增 长 的 状态 。 如 图 2-1 所 示 ， 在 知名 行业 网 站 www. aiim. org 上 ， 
列 出 了 目前 企业 内 容 管理 逐步 形成 的 七 大 核心 功能 组 件 ; 

1) 文档 管理 : 包括 文档 发 布 和 获取 校 验 ， 版 本 控制 ， 安 全 性 检验 以 及 对 商 
业 文 件 提 供 存储 检索 服务 。 

2) Web 内 容 管理 : 突破 网 站 管理 员 的 瓶 天 ,实现 网 页 内 容 管理 自动 化 ， 动 
态 内 容 的 管理 以 及 内 容 授 权 。 

3) 记录 管理 : 为 每 一 条 单独 的 企业 信息 分 配 专门 的 生命 周期 记录 ， 从 信息 
产生 、 接 收 、 维 护 、 使 用 直到 最 后 的 处 理 都 将 被 记录 下 来 。 

4) 影像 管理 : 用 于 纸 质 文档 的 获取 与 管理 的 文档 获取 与 成 像 技术 。 

5) 协作 管理 : 为 项 目 团队 提供 文档 共享 与 支持 的 文档 中 心 协作 功能 。 

6) 电子 出 版 物 管理 : 针对 载 有 出 版 物 内 容 的 可 刻录 光盘 、 数 据 磁 带 、 计 算 
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工作 流 和 检索 








图 2-1 企业 内 容 管理 的 七 大 核心 功能 组 件 


机 软件 等 电子 出 版 物 的 整个 生命 周期 ， 进 行 有 效 管理 。 
7) 工作 流 和 检索 : 支持 商业 流程 和 内 容 传递 的 工作 流 ， 配 置 工作 任务 和 状 
态 并 创建 查找 索引 ， 支 持 全 文 搜索 和 分 类 搜索 。 


2.1.3 企业 内 容 管理 的 内 涵 


企业 内 容 管理 的 产品 表现 为 一 个 管理 软件 和 技术 ,但 它 更 是 一 种 管理 思想 的 
反映 。 因 为 有 效 的 内 容 管理 仅 靠 一 个 优秀 的 内 容 管理 系统 是 不 够 的 ， 很 简单 的 一 
个 事实 就 是 : 一 套 再 好 的 系统 ， 没 人 愿意 使 用 它 ， 也 只 不 过 是 个 摆设 。 有 效 的 内 
容 管理 首先 取决 于 愿意 分 享 内 容 的 文化 。 在 此 基础 上 ， 结 合 企业 业务 过 程 ， 理 顺 
内 容 创建 、 存 储 、 分 享 、 应 用 、 更 新 过 程 ， 并 制定 相关 的 管理 机 制 ， 最 后 内 容 管 
理 系统 作为 一 种 技术 支撑 。 

为 使 内 容 管理 真正 发 挥 作用 ， 并 不 单单 是 建立 一 个 技术 性 的 内 容 管理 系统 就 
能 解决 的 ， 它 是 一 项 结合 人 、 过 程 以 及 技术 的 “技术 -社会 ”工程 。 在 人 方面 ， 
需要 建立 专门 的 内 容 管理 机 制 ， 指 派 特 定 的 内 容 人 员 (如 内 容 经 理 、 内 容 编 辑 
等 ) 进行 内 容 的 管理 和 维护 ， 而 在 过 程 方面 ， 要 建立 透明 的 内 容 管理 过 程 ， 包 
括 内 容 的 创建 、 存 储 、 分 享 、 应 用 和 更 新 ， 并 要 将 内 容 管理 过 程 和 具体 的 业务 过 
程 紧 密 结 合 ， 使 内 容 “ 从 业务 中 来 ， 并 到 业务 中 去 ”; 在 技术 方面 ， 主 要 就 是 要 
建立 一 套 内 容 管理 系统 ， 为 内 容 人 员 以 及 内 容 管理 过 程 提 供 技 术 上 的 支撑 环境 。 


2.1.4 企业 内 容 管理 的 效益 


企业 内 容 管理 能 有 效率 地 生产 、 管 理 与 发 布 多 元 化 的 内 容 ， 轻 易 满 足 政府 与 
企业 内 部 ， 员 工 与 管理 阶层 ， 以 及 外 部 合作 厂商 、 客 户 与 企业 投资 者 对 内 容 的 需 
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求 。 在 实施 企业 内 容 管理 的 客户 中 ， 相 当 多 的 成 功 案 例 都 是 因为 内 容 管理 而 使 原 
有 的 资产 增值 帮助 企业 获 益 。 通 过 内 容 管理 ， 政 府 和 企业 可 以 实现 把 正确 、 实 时 
的 内 容 传递 给 适当 的 人 ,并 且 进 行 最 有 效率 的 管理 ,在 信息 产生 后 ， 能 反复 利 
用 ， 以 此 大 幅 降低 花费 在 数据 管理 、 查 询 与 检索 上 的 时 间 与 成 本 。 

好 的 内 容 管理 能 够 有 效 地 管理 不 同形 式 、 平 台 、 服 务 器 的 多 元 化 内 容 ， 严 格 
地 管理 需要 发 布 的 信息 ， 以 确保 信息 的 正确 性 ， 为 企业 提供 一 个 高 扩展 性 、 低 成 
本 的 文档 、 多 媒体 、 程 序 代 码 和 网 站 等 内 容 平 台 。 同 时 还 能 改善 现 有 网 站 从 协调 
开发 到 最 后 维护 的 流程 ， 解 决 过 度 集中 处 理 的 瓶 须 ; 为 不 同 内 容 提 供 者 提供 各 种 
内 容 输入 渠道 ， 提 高 网 页 更 新 速度 ， 提 升 内 容 丰 富 度 ， 增 进 服务 效率 。 





























2.2 企业 内 容 管 理 的 发 展 历史 和 趋势 


2.2.1 企业 内 容 管 理 的 发 展 历 史 


企业 内 容 管 理 不 是 某 种 单独 的 创新 技术 ， 而 是 许多 先进 技术 的 综合 应 用 ， 它 
涵盖 企业 内 联网 (Intranet)、 因 特 网 (Internet) 和 企业 外 联网 (Extranet) 的 应 
用 ,大 大 突破 了 传统 信息 流 管理 软件 、 办 公 自 动 化 软件 以 及 文档 管理 软件 的 应 用 
范围 、 使 用 效果 和 商业 价值 。 专 业 的 行业 组 织 AIIM 对 企业 内 容 管 理 的 发 展 历史 
描述 为 以 下 几 个 阶段 ， 见 表 2-1， 开 放 的 、 标 准 化 的 企业 内 容 管理 是 六 个 阶段 中 


的 最 高 阶段 。 





表 2-1 企业 内 容 管 理 的 发 展 历史 阶段 


















































发 展 历史 阶段 时 间 范 转 代 表 
影像 管理 和 早期 协同 20 世纪 80 年 代 中 期 IBM FileNet ,ViewStar ,Lotus 
电子 文档 管理 20 世纪 90 年 代 Documentum ,Saros ,PCDocs 
Web 内 容 管理 20 世纪 90 年 代 中 期 Netscape ,Vignette ,Interwoven 
高 级 的 内 容 管理 概念 2000 年 左右 DRM ,DAM ,Lifecycle Mgmt 
ECM 的 合并 开放 的 Web 内 容 管理 2005 年 OpenCMS ,Mambo ,Drupal ,Plone 
开放 ,标准 化 的 ECM 2009 年 以 来 JCR, CMIS 








目前 的 内 容 管 理 厂 商 可 以 分 为 3 大 类 ， 第 一 类 是 Interwoven 、Broadvision 、 
Vignette 和 Documentum 等 国际 大 厂商 ， 它 们 进入 这 一 领域 的 时 间 最 早 ， 因 而 推 
出 的 方案 和 软件 具有 功能 齐全 、 应 用 成 熟 的 特点 ， 但 是 其 价格 也 十 分 昂贵 ;第 二 
类 是 诸如 Oracle 、Sybase 、Informix (已 被 IBM 收购 ) 这 样 的 拥有 数据 库 技 术 的 
厂商， 作为 这 一 类 广 商 中 的 后 来 者 ，IBM、 微 软 的 发 展 吊 吊 逼 人 ; 第 三 类 就 是 国 
内 内 容 管理 厂商 ， 中 软 、 汇 智 容 大 、 易 宝 北 信 、 国 信 贝 斯 、 联 想 等 都 是 其 中 的 代 
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表 厂 商 。 
2.2.2 企业 内 容 管 理 的 发 展 趋势 


内 容 管理 的 发 展 趋势 是 从 最 初 的 各 自 独 立 的 Web 内 容 管理 、 文 档 管理 等 过 
渡 到 集成 Web 内 容 管理 (WCM) 、 文 档 管 理 (DM) 、 数 字 资 产 管理 (DAM ) 、 
影像 (Imaging) 管理 、 记 录 管 理 (RM) 、 协 作 ( Collaboration) 管理 、 知 识 管理 
(KM) 、 门 户 〈Portal) 为 一 体 的 企业 内 容 管理 (ECM ) 。 

企业 内 容 管理 技术 的 发 展 将 出 现 异 构 化 、 标 准 化 、 智 能 化 、 平 台 化 的 趋势 ， 
并 面临 更 多 样 化 的 内 容 应 用 管理 需要 。 

1) 异 构 化 和 标准 化 ， 需要 具备 管理 越 来 越 丰富 的 多 元 异 构 信 息 的 能 力 和 开 
放 数 据 标 准 XML 以 及 相关 的 数据 标准 。 

2) 智能 化 : 引入 类 似 内 容 控 掘 等 智能 技术 强化 内 容 处 理 和 分 析 功 能 ， 表 现 
为 独立 的 智能 内 容 分 析 组 件 或 认 入 内 容 采 集 、 处 理 、 组 织 、 发 布 等 各 过 程 中 的 智 
能 增强 功能 。 

3) 平台 化 : 内 容 管理 应 用 将 与 企业 业务 活动 及 专业 系统 紧密 结合 ， 呈 现行 
业 化 趋势 。 需 要 将 内 容 管理 技术 抽象 组 合 ， 实 现成 为 组 件 化 功能 性 中 间 件 应 用 平 
台 ， 提 供 开放 的 内 容 应 用 服务 或 开发 接口 以 支撑 多 样 化 的 上 层 应 用 。 

另外 ， 内 容 管 理 平台 需要 能 够 管理 日 益 丰 富 的 或 新 兴 的 内 容 应 用 和 分 发 渠 
道 ， 包 括 博 客 平台 、RSS 内 容 聚 合 、 搜 索 服 务 、 内 容 商务 、P2P 内 容 搜索 和 整 
合 、3G 内 容 等 。 

总 之 ，ECM 将 向 标准 化 、 普 及 化 、 简 单 化 、 轻 量 级 、 更 加 易于 使 用 发 展 ; 
ECM 将 采用 新 技术 ， 以 适应 企业 将 来 的 动态 服务 需求 ， 企 业 业 务 模型 也 将 随 着 
改变 ; ECM 将 分 散 ， 联 合 和 集成 企业 其 他 系统 ; ECM 将 与 数据 库 系 统一 样 ， 成 
为 企业 信息 化 必 不 可 少 的 基础 系统 。 





























2.3 企业 内 容 管理 系统 


2.3.1 企业 内 容 管理 系统 的 体系 结构 


企业 内 容 管理 系统 (Enterprise Content Management System，ECMS) 的 功能 
是 实现 对 系统 所 管理 的 任何 资源 的 访问 都 是 经 过 授权 的 ， 所 以 ECMS 的 核心 是 用 
户 、 资 源 内 容 以 及 上 述 两 者 的 关系 。 

企业 内 容 管理 系统 与 关系 型 数据 库 系 统一 样 ， 事 实 上 也 是 一 种 数据 管理 系 
统 ， 只 是 管理 的 数据 对 象 有 所 不 同 。 关 系 型 数据 库 系 统管 理 的 是 一 种 被 称 为 
“二 维 结构 ”的 表 对 象 ， 而 企业 内 容 管理 系统 管理 的 数据 对 象 ， 则 被 称 为 “ 非 结 


第 2 章 企业 内 容 管理 “27 ， 





构 化 ”的 数据 ， 视 音频 数据 、 图 像 数据 、 大 文本 数据 是 这 类 数据 对 象 的 典型 代 
表 。 企 业内 容 管理 系统 的 一 个 最 重要 的 任务 就 是 以 逻辑 关系 的 方式 对 “ 非 结构 
化 ”数据 进行 组 织 ， 实 现 对 这 些 数 据 的 创建 和 应 用 与 物理 存储 完全 隔离 。 由 此 
可 见 ， 内 容 管理 系统 不 依赖 特定 的 应 用 ， 是 “ 非 结构 化 数据 的 管理 引擎 或 管理 


世人 和” 
[mE 


对 于 任何 平台 来 说 ， 良 好 的 架构 对 于 系统 的 重要 性 是 不 言 而 喻 的 ， 尤 其 是 企 
业内 容 管 理 系统 。 内 容 管理 平台 软件 需要 考虑 如 何 实现 灵活 高 效 的 数据 模型 ， 如 
何 设计 各 种 语言 的 API， 如 何 实现 完善 的 访问 控制 管理 ， 以 及 如 何 架 构 系 统 的 折 
扑 以 完成 数据 迁移 、 缓 存 ， 如 何 支 持 PB 级 的 存储 和 上 千 的 并 发 用 户 。 企 业内 容 
管理 系统 尤其 需要 考虑 到 未 来 的 扩展 能 力 ， 如 何在 最 大 化 保护 用 户 现 有 投资 的 情 
况 下 ， 提 供 无 限 的 可 扩展 空间 。 

由 于 企业 内 容 管 理 牵涉 的 范围 广 ， 使 得 平台 在 选择 技术 时 必须 使 用 大 量 的 成 
熟 稳定 的 技术 ， 而 且 必须 符合 业界 标准 。 此 外 ， 当 这 些 技术 发 展 时 ， 企 业内 容 管 
理 平 台 必 须 能 够 支持 这 些 新 的 技术 以 及 新 的 标准 。 同 时 还 要 在 技术 、 软 件 、 平 台 
本 吴 升 级 时 保护 用 户 原 有 的 数据 。 

一 个 统一 、 完 整 、 集 成 、 开 放 、 可 扩展 的 企业 内 容 管理 系统 体系 结构 如 
图 2-2 所 示 。 它 是 一 个 典型 的 Web 架构 ， 分 为 浏览 器 、 应 用 服务 器 、 存 储 三 层 
结构 ， 应 用 服务 器 是 企业 面向 客户 的 应 用 与 内 部 处 理 过 程 之 间 的 重要 连接 ， 它 将 
采集 、 管 理 、 存 储 、 保 存 及 交付 内 容 的 技术 、 工 具 与 方法 操作 封装 其 内 ， 处 理 包 
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图 2-2 企业 内 容 管 理 系 统 的 体系 结构 





括 用 户 的 UI (用 户 界 面 ) 接口 和 数据 及 内 容 的 持久 化 存储 操作 。 提 供 一 系列 可 
重用 的 内 容 管理 服务 ， 包 括 内 容 存 储 、 查 询 、 版 本 跟踪 、 格 式 转换 等 。 包 含 在 应 
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用 层 服务 中 的 每 一 个 部 分 都 是 一 个 组 件 或 者 服务 ， 采 用 组 件 和 服务 方式 的 服务 模 
型 ， 在 构建 新 的 应 用 时 ， 不 需要 了 解 组 件 或 服务 内 部 实现 的 机 制 ， 就 可 以 直接 使 
用 组 件 或 访问 接口 服务 。 

应 用 层 服 务 的 核心 功能 是 提供 内 容 的 存储 和 检索 。 在 具体 设计 中 ， 将 其 拆 分 
为 节点 、 内 容 和 索引 信息 三 个 关键 的 基础 服务 。 系 统 中 所 有 的 其 他 基础 服务 都 依 
赖 于 这 三 个 核心 的 基础 服务 模块 。 

基于 Web 架构 的 企业 内 容 管理 系统 ， 客 户 端 不 需要 安装 特殊 的 软件 ， 通 过 
浏览 器 就 可 以 登录 到 应 用 服务 器 上 。 操 作 人 员 通 过 Web 浏览 器 和 用 户 的 UI (用 
户 界面 ) 接口 ， 将 请 求 交付 给 应 用 服务 器 ; 应 用 服务 器 将 数据 和 内 容 按照 需要 ， 
持久 化 存储 在 数据 库 中 或 者 服务 天 文件 系统 内 。 


2.3.2 企业 内 容 管理 系统 的 功能 


下 面 从 技术 角度 来 看 一 下 企业 内 容 管 理 系 统 应 该 提供 的 功能 ， 一 个 完整 的 企 
业内 容 管理 系统 应 包括 以 下 几 个 部 分 : 内 容 仓库 、 内 容 搜 索引 擎 、 内 容 管 理 功 能 
模块 、 用 户 接口 以 及 内 容 访 问 设 备 等 。 

1) 内 容 仓库 : 用 来 存储 各 种 形式 的 内 容 ， 如 文档 、 视 频 、 音 频 文 件 、 文 件 
系统 资源 、 应 用 代码 和 XML 文档 等 ; 它 应 支持 所 有 内 容 格式 、 支 持 所 有 编辑 工 
具 、 支 持 所 有 信息 来 源 。 

2) 内 容 搜索 引擎 : 企业 内 容 管理 系统 的 核心 功能 模块 ， 用 以 帮助 使 用 者 快 
速 定位 所 需 内 容 ， 促 进 内 容 的 挖掘 与 使 用 。 按 照 搜索 方法 可 分 为 全 文 搜 索 、 上 下 
文 搜索 等 。 现 在 更 先进 的 检索 技术 还 包括 智能 化 知识 检索 技术 ， 自 然 语言 查询 、 
数字 特征 的 提取 和 检索 技术 等 。 

3) 企业 内 容 管理 模块 : 这 是 企业 内 容 管理 系统 的 主要 功能 模块 ， 用 以 提供 
对 内 容 管 理 过 程 的 支持 ， 包 括 : 

QD 内 容 创 建 和 编辑 一 一 用 以 实现 各 种 数据 、 信 息 、 文 档 和 程序 的 获取 并 提 
供 创建 内 容 的 协作 工具 ， 如 文档 和 网 页 制作 工具 ， 数 据 转 换 (元 数据 和 XML) 
工具 等 。 

凶 ) 内 容 个 性 化 一 一 内 容 的 个 性 化 是 内 容 管理 区 别 于 传统 文档 管理 的 一 个 重 
要 特征 ， 包 括 根据 用 户 喜 好 的 用 户 控制 个 性 化 、 根 据 内 容 相关 性 的 数据 控制 个 性 
化 等 。 

@) 存档 管理 一 一 用 以 实现 安全 存储 、 管 理 各 种 形式 的 内 容 。 



































( 工作 流 一 一 用 以 实现 用 户 自 定义 的 流程 和 基于 角色 的 流程 控制 、 审 批 流 
程 等 。 
(9 安全 控制 一 一 包括 数据 库 的 安全 控制 、 加 密 ， 找 贝 和 传播 限制 等 。 





@ 生命 周期 管理 一 一 主要 是 指 对 内 容 版 本 的 控制 ， 如 多 版 本 控制 、 版 本 跟 
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踪 等 功能 。 

4) 用 户 接 口 模块 : 包括 传统 的 非 Web 方式 的 图 形 用 户 界 面 (GUI) 以 及 新 
近 发 展 起 来 的 企业 信息 门户 (EIP) 等 各 种 方式 ，EIP 将 成 为 未 来 用 户 接口 的 主 
导 方 式 。 

5) 内 容 访问 设备 : 包括 客户 计算 机 以 及 PDA 、 移 动 电话 等 移动 型 设备 。 


2.3.3 企业 内 容 管理 系统 的 组 成 


企业 内 容 管理 系统 是 一 个 由 需要 管理 的 内 容 、 管 理 内 容 的 人 、 管 理 的 过 程 以 
及 管理 技术 所 组 成 的 综合 系统 ， 而 不 仅仅 是 一 个 技术 系统 。 

1) 内 容 管理 需要 处 理 结构 化 的 数据 库 信 息 以 及 文本 、HIML、XML、PPT、 
PDF、RTF 、 声 音 、 视 频 、 图 像 、 目 录 文 档 等 各 种 非 结构 化 的 信息 。 

2) 管理 内 容 的 人 员 包 括 内 容 决策 、 内 容 编辑 、 网 页 制作 和 编程 人 员 等 ， 每 
种 人 员 都 有 明确 的 任务 分 工 ， 以 不 同 的 角色 对 内 容 实 施 管理 与 维护 。 

3) 内 容 管理 的 过 程 包括 内 容 的 创建 、 存 储 、 分 享 、 应 用 和 更 新 ， 并 将 内 容 
管理 过 程 和 具体 业务 过 程 紧 密 结 合 ， 形 成 基于 角色 的 工作 流 机 制 ， 减 少 业 务 瓶 
有 贷 ， 提 高 内 容 管理 效率 。 

4) 管理 技术 就 是 要 建立 一 套 内 容 管理 系统 ， 为 内 容 管理 人 员 以 及 内 容 管理 
过 程 提供 技术 上 的 支撑 环境 。 





2.4 知识 管理 


依靠 强大 的 知识 力量 可 以 重 塑 企业 的 命运 ， 随 着 传统 结构 性 优势 的 消退 ， 更 
多 的 产品 和 服务 出 现在 世界 大 舞台 上 角逐 ， 围 绕 知 识 产 生 的 战略 将 改变 游戏 规 
则 ， 并 开辟 出 新 的 获 利 途径 。 


2.4.1 知识 的 定义 


知识 ， 作 为 一 个 被 广泛 使 用 的 词 ， 其 内 涵 和 外 延 因 使 用 者 不 同 而 异 。 一 般 可 
区 分 为 狭义 和 广义 的 两 种 概念 。 根 据 韦 伯 斯 特 词典 1997 年 的 定义 ， 知 识 是 通过 
实践 、 人 研究 、 联 系 或 调查 获得 的 关于 事物 的 事实 和 状态 的 认识 ， 是 对 科学 、 艺 术 
或 技术 的 理解 ， 是 人 类 获得 的 关于 真理 和 原理 的 认识 的 总 和 。 

广义 的 知识 观 是 智力 的 知识 观 。 我 国 在 《中 国 大 百科 全 书 》 中 把 知识 定义 
为 “客观 事物 的 属性 与 联系 的 反映 ， 是 客观 世界 在 人 脑 中 的 主观 映 象 ” ， 按 其 来 
源 分 ， 有 直接 知识 和 间接 知识 ; 前 者 从 人 类 社会 实践 中 直接 获得 ， 后 者 通过 书本 
或 其 他 途径 获得 。 这 是 一 种 狭义 的 知识 概念 。 它 大 致 与 现代 认 知 心理 学 中 的 陈述 
性 知识 相当 。 广 义 的 知识 可 分 两 大 类 和 三 亚 类 ， 两 大 类 即 陈述 性 知识 和 程序 性 知 
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识 的 划分 。 三 亚 类 指 除 把 陈述 性 知识 作为 第 一 类 知识 之 外 ， 在 程序 性 知识 中 再 划 
分 出 一 类 特殊 的 ， 用 于 支配 和 调节 人 们 自身 的 学 习 、 记 忆 和 思维 等 认 知 过 程 的 程 
序 性 知识 ， 即 策略 性 知识 。 

总 之 ， 知 识 是 人 类 积累 的 关于 自然 和 社会 的 认识 和 经 验 的 总 和 ， 这 就 是 广义 
的 知识 概念 。 

经 济 合作 与 发 展 组 织 为 了 有 利于 经 济 分 析 ， 将 广义 的 知识 按 内 容 分 为 如 下 四 
种 : 关于 “知道 是 什么 ”的 知识 ， 记 载 事实 的 数据 ; 关于 “知道 为 什么 ”的 知 
识 ， 记 载 自然 和 社会 的 原理 与 规律 方面 的 理论 ; 关于 “知道 怎样 做 ”的 知识 ， 
间 某 类 工作 的 实际 技巧 和 经 验 ; 关于 “知道 是 谁 ” 的 知识 ， 指 谁 知道 是 什么 、 
谁 知道 为 什么 和 谁 知道 怎么 做 的 信息 。 

西方 哲学 家 将 知识 分 为 两 种 : 先 验 知识 与 后 验 知识 。 先 验 知识 意味 着 仅 赁 推 
理 得 到 的 知识 〈 先 于 经 验 观察 ) ， 而 不 受 直 接 或 间接 经 验 (这 里 经 验 通常 指 通过 
感官 对 于 世界 的 观察 ) 的 影响 。 后 验 知识 指 其 他 种 类 的 知识 ， 也 就 是 知识 的 得 
来 和 证 实 需 要 借助 经 验 (经 验 观察 之 后 ) ， 也 被 称 作 经 验 性 知识 。 


2.4.2 知识 管理 


























对 于 知识 管理 (Knowledge Management, KM) 的 定义 ， 可 谓 仁 者 见 仁 、 告 
者 见 智 ， 可 将 其 归结 为 行为 学 派 、 技 术 学 派 、 综 合 学 派 三 大 学 派 ， 如 图 2-3 
所 示 。 











知识 库 

知识 管理 技术 
信息 技术 平台 
知识 管理 系统 







知识 型 组 织 
知识 管理 观念 
知识 管理 战略 
知识 管理 制度 









图 2-3 三 种 不 同 知识 学 派对 知识 的 理 角 





了 


1. 行为 学 派 

行为 学 派 认 为 ， 知 识 管理 就 是 对 人 的 管理 。 行 为 学 派 研究 的 角度 包括 : 从 组 
织 结 构 的 角度 研究 知识 型 组 织 ; 从 企业 文化 的 角度 研究 知识 管理 观念 ， 如 学 习 型 
组 织 ; 从 企业 战略 角度 研究 企业 知识 管理 战略 ， 从 人 力 资源 的 绩效 考评 和 激励 角 
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度 研究 知识 管理 制度 ; 从 学 习 模 式 的 角度 研究 个 人 学 习 、 团 队 学 习 和 组 织 学 
习 等 。 

2. 技术 学 派 

技术 学 派 认 为 ， 知 识 管理 就 是 对 信息 的 管理 。 技 术 学 派 研究 的 角度 包括 ， 从 
知识 组 织 的 角度 研究 知识 表示 和 知识 库 ; 从 知识 共享 的 角度 研究 团队 通信 与 协作 
的 技术 ; 从 技术 实现 的 角度 研究 知识 地 图 系统 、 知 识 分 类 系统 、 经 验 分 享 系统 、 
统一 知识 门户 技术 等 ， 从 系统 整合 的 角度 研究 知识 管理 系统 与 OA (办 公 自 动 
化 ) 系统 、ERP (企业 资源 计划 ) 等 系统 的 整合 等 。 

3. 综合 学 派 

综合 学 派 认 为 ， 知 识 管理 不 但 要 对 信息 和 人 进行 管理 ， 还 要 将 信息 和 人 连接 
起 来 进行 管理 ， 知 识 管理 要 将 信息 处 理 能 力 和 人 的 创新 能 力 相 互 结合 ， 增 强 组 织 
对 环境 的 适应 能 

综合 学 派 强 调 知识 管理 是 一 套 企业 的 整体 解决 方案 ， 包 括 知 识 管理 观念 、 知 
识 管理 战略 、 知 识 型 的 组 织 结构 、 知 识 管理 制度 、 知 识 管理 模板 等 问题 。 在 此 基 
础 上 ， 将 知识 管理 制度 流程 化 、 信 息 化 ， 将 知识 管理 表格 和 模板 界面 化 、 程 序 
化 ， 将 企业 知识 分 类 化 、 数 据 库 化 ， 在 考虑 与 其 他 现 有 系统 集成 的 基础 上 ， 开 发 
或 购买 相应 知识 管理 软件 ， 实 现 企 业 的 知识 管理 系统 。 

简 而 言 之 ， 知 识 管理 就 是 利用 组 织 智力 或 知识 资产 创造 价值 的 过 程 。 人 在 获 
取 知 识 的 过 程 中 与 信息 的 这 种 相互 作用 和 内 在 联系 决定 了 “知识 管理 ”是 一 种 
对 人 与 信息 资源 的 动态 管理 过 程 。“ 知 识 管理 ”应 是 以 “人 ”为 中 心 ， 以 信息 为 
基础 ， 以 知识 创新 为 目标 ， 将 知识 看 作 是 一 种 可 开发 资源 的 管理 思想 。 简 单 说 
“知识 管理 ”就 是 人 在 企业 管理 中 对 其 集体 的 知识 与 技能 (不 管 它 是 写 在 纸 上 ， 
还 是 存在 人 脑 中 ) 的 捕获 与 运用 的 过 程 。 

知识 管理 作为 知识 经 济 时 代 出 现 的 新 兴 管 理 思想 ， 并 不 孤立 于 企业 经 营 管理 
体系 之 外 。 它 本 身 就 是 从 其 他 管理 领域 中 提取 有 关 “ 和 知识” 的 管理 理念 ， 经 过 
抽象 和 综合 分 析 ， 才 逐渐 形成 的 一 种 战略 思想 。 因 此 ， 从 它 诞生 的 那 一 天 起 ， 就 
与 战略 管理 、 人 力 资源 、 财 务 、 行 政 、 市 场 、 研 究 与 开发 等 管理 领域 有 着 千 丝 万 
缕 的 联系 。 知 识 管理 应 该 以 知识 管理 的 战略 为 主 ， 通 过 战略 管理 来 推动 企业 管理 
的 各 个 层面 的 升级 和 改造 。 











2.5 企业 内 容 管理 和 知识 管理 


企业 内 容 管理 常 被 视 为 知识 管理 的 基础 建设 ， 知 识 管理 是 企业 由 下 而 上 、 累 
积 智能 的 系统 方法 , 已 有 近 20 年 的 历史 ， 虽 然 在 技术 与 方法 上 不 断 演进 ， 但 在 
实际 应 用 中 因 投 资 回报 不 易 评估 ， 更 需 企业 文化 的 配合 ， 让 大 家 养 成 知识 与 人 共 
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享 的 意愿 ， 所 以 发 展 并 不 迅速 。 
2.5.1 两 者 的 区 别 


1. 管理 对 象 的 不 同 

企业 内 容 管理 的 对 象 是 “内 容 ”， 而 知识 管理 的 对 象 是 “知识 ”。 内 容 主 要 
是 对 各 种 结构 化 数据 、 非 结构 化 文档 、 信 息 的 统称 ， 某 种 程度 上 也 包含 了 知识 ， 
但 这 种 知识 主要 是 一 种 明晰 性 的 显 性 知识 。 而 “知识 ”不 仅 包 含 了 明晰 性 知识 ， 
还 有 隐 含 性 知识 ， 而 且 后 者 更 大 程度 上 体现 了 “知识 ”的 价值 。 

2. 管理 功能 上 的 不 同 

知识 管理 不 仅 在 于 对 静态 知识 〈 知 识 库 ) 的 管理 ， 还 包括 对 动态 知识 过 程 
的 管理 ， 尤 其 是 对 知识 创新 过 程 的 管理 。 著 名 的 知识 管理 大 师 野 中 将 知识 分 为 隐 
性 和 显 性 两 种 不 同类 型 的 知识 ， 并 认为 知识 管理 就 主要 表现 为 对 这 两 类 知识 间 相 
互 转化 而 形成 的 知识 螺旋 的 管理 ， 包 括 由 隐 性 知识 转换 为 隐 性 知识 的 知识 社会 化 
管理 、 由 隐 性 知识 转换 为 显 性 知识 的 知识 明晰 化 管理 、 由 显 性 知识 转换 为 显 性 知 
识 的 知识 关联 化 管理 ， 以 及 由 显 性 知识 转换 为 隐 性 知识 的 知识 内 省 化 管理 。 而 内 
容 管理 某 种 程度 上 主要 是 对 知识 关联 化 过 程 的 管理 ， 即 将 分 散 混乱 的 数据 、 信 息 
转化 成 有 组 织 的 内 容 和 知识 ， 基 本 上 不 具备 对 隐 性 知识 的 管理 功能 。 


2.5.2 联系 之 处 


知识 管理 关注 的 是 对 企业 内 外 部 的 显 性 、 隐 性 知识 的 管理 ， 显 性 知识 包括 内 
外 部 的 研究 报告 、 标 准 规范 、 程 序 文档 和 数据 等 ; 而 隐 性 知识 包括 隐藏 在 人 的 大 
脑 中 的 经 验 ， 以 及 隐 含 在 企业 业务 中 还 没有 被 发 现 的 知识 或 经 验 。 内 容 管理 中 的 
“内 容 ” 实 质 上 就 是 任何 类 型 的 数字 信息 可 以 是 文本 、 图 形 图 像 、 
Web 页 面 、 业 务 文档 、 数据 库 表单 、 视 频 、 音 文 件 等 。 从 这 点 上 看 内 容 管理 
主要 是 对 显 性 知识 的 管理 。 

知识 是 企业 中 最 有 价值 的 财富 之 一 ， 据 统计 ， 企 业 中 80% 的 知识 都 直接 或 
间接 隐藏 在 内 容 之 中 。 所 以 内 容 可 以 看 成 是 企业 的 内 容 ， 内 容 管理 是 进行 知识 管 
理 的 前 提 条 件 ， 内 容 管理 系统 可 以 作为 知识 管理 的 支撑 平台 ， 它 管理 知识 管理 所 
需 的 基础 信息 ， 并 通过 分 类 和 检索 便于 知识 管理 进行 分 析 和 综合 。 所 以 知识 管理 
和 内 容 管理 的 集成 也 是 目前 的 一 个 研究 方向 。 

简 言 之 ， 知 识 管理 可 以 利用 内 容 管理 达到 企业 目标 。 一 个 综合 的 内 容 
统 ， 根 据 文档 管理 参考 模型 a 内 容 和 
作 流 管理 等 ， 可 以 帮助 企业 将 数据 、 内 容 转换 成 为 知识 。 














































































































第 3 童 内 容 仓库 的 标准 化 接口 


内 容 仓库 (Content Repository ，CR) 关注 企业 内 部 非 结 构 化 数据 的 存储 和 管 
理 ， 是 信息 管理 的 基础 设施 ， 是 国际 上 信息 管理 领域 的 研究 热点 ， 内 容 仓库 是 未 
来 信息 化 的 基础 ， 标 准 化 是 内 容 仓库 的 发 展 方向 。 一 般 而 言 ， 内 容 仓库 指 存储 文 
件 、 数 据 的 系统 ， 这 个 系统 底层 实现 可 能 是 关系 数据 库 、 文 件 系统 或 者 一 
XML 文件 等 实际 存储 的 设备 /系统 ; 但 CR 隐藏 了 这 些 底层 实现 ， 并 且 支 持 存 取 
文档 操作 以 及 一 些 高 级 操作 : 存 取 控 制 、 搜 索 、 版 本 管理 等 功能 。 因 此 可 将 CR 
视 为 传统 数据 存储 的 一 个 超 集 。 

由 于 市 场 上 对 企业 内 容 管理 系统 有 着 非常 强烈 的 需求 ， 越 来 越 多 的 软件 企业 
和 研究 组 织 投 吴 于 这 类 应 用 软件 的 研究 开发 中 ， 近 年 来 国内 外 的 许多 高 校 和 企业 
的 研究 部 门 都 把 内 容 管理 列 为 主要 的 研究 对 象 之 一 。 在 内 容 管理 这 个 新 兴 和 不 成 
熟 的 市 场 中 ,大量 的 厂商 按照 自己 的 理解 提出 多 种 多 样 的 产品 理念 、 体 系 架 构 、 
功能 性 ， 这 些 系统 都 建立 在 他 们 各 自 的 内 容 仓库 之 上 ， 拥 有 自己 的 私有 内 容 仓库 
引擎 ， 导 致 当前 的 内 容 管理 系统 缺乏 统一 标准 且 交 互 和 维护 困难 。 

随 着 内 容 管理 应 用 程序 的 日 益 普 及 ， 对 用 于 内 容 仓库 的 普通 、 标 准 化 API 
的 需求 已 凸现 出 来 。Java 的 内 容 存 储 库 API (Content Repository API for Java Tech- 
nology) 的 目标 就 是 提供 这 样 一 个 接口 。Java 内 容 仓库 (Java Content Repository ， 
JCR) 标准 ， 具 体 由 Java 规范 请 求 JSR-170 和 JSR-283 指定 ， 是 一 个 以 独立 方式 
来 双向 访问 一 个 内 容 仓 库 内 粒度 级 别 内 容 的 实现 ，JSR-170 标准 对 应 JCR1. 0， 
JSR-283 标准 对 应 JCR2. 0。 

JCR 标准 允许 把 可 重复 使 用 的 资源 库 功 能 ， 比 如 搜索 、 版 本 控制 、 访 问 控制 
等 ， 从 特定 应 用 程序 功能 中 明确 地 分 离 出 来 。 这 使 得 开发 人 员 专 注 于 应 用 程序 的 
大 大 缩短 了 开发 时 间 。 不 同 的 应 用 程序 可 以 使 用 相同 的 API 来 访问 内 

， 使 开发 和 维护 变 得 更 加 高 效 ， 改 善 内 容 应 用 程序 所 有 权 的 总 成 本 。 


















































3.1 引言 
3.1.1 背景 





企业 内 容 管理 系统 的 发 展 经 历 了 集中 式 管理 、 分 散 式 管理 、 分 布 式 管理 ， 在 
互联 网 应 用 日 趋 广泛 的 今天 ， 如 何 基 于 Web 网 络 环境 ， 实 现 一 个 开放 、 标 准 化 、 
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统一 的 企业 内 容 管理 系统 ， 已 成 为 企业 内 容 管理 系统 研究 领域 的 一 个 重要 方向 。 
其 中 ， 对 标准 化 内 容 仓库 接口 的 需求 比 以 往 任何 时 候 都 更 加 显著 。 

复杂 的 目标 可 以 实现 用 一 个 非常 简单 的 接口 来 实现 ， 这 个 原则 ， 也 可 以 运用 
到 内 容 管理 应 用 开发 领域 。 基 于 内 容 中 心 化 的 设计 和 标准 化 的 规约 ， 是 高 效 实现 
内 容 管理 系统 的 一 个 基础 。 一 个 以 内 容 为 中 心 的 接口 ， 专 注 于 内 容 的 统一 性 质 ， 
而 不 是 任何 特定 应 用 的 特定 控制 ， 简 化 了 应 用 集成 的 任务 。 

内 容 仓库 是 一 个 通用 的 应 用 程序 数据 的 “超级 商店 ” 。 除 了 善于 处 理 小 型 和 
大 型 数据 交互 ， 一 个 内 容 库 还 要 处 理 和 存储 结构 化 和 非 结 构 化 内 容 ， 二 进 制 和 文 
本 格式 ， 元 数据 和 动态 变化 的 关系 。 高 级 内 容 服务 的 支持 也 是 需要 的 ， 如 统一 的 
访问 控制 、 锁 定 、 事 务 、 版 本 控制 、 观 察 ， 以 及 搜索 。 在 某 些 情况 下 ， 一 个 内 容 
仓库 将 被 徐 入 到 同一 台 服 务 器 的 应 用 程序 中 ， 而 在 其 他 情况 下 ， 基 于 可 用 性 和 负 
载 平衡 的 缘故 ， 它 将 被 放 在 单独 的 服务 器 上 。 

可 以 把 内 容 仓 库 看 作 是 一 个 通用 的 数据 存储 程序 ， 可 以 用 于 存储 文本 和 其 他 
二 进 制 文件 (图 片 、Word、PDF 等 ) ， 而 内 容 管理 系统 指 在 内 容 仓库 的 基础 上 ， 
进行 更 客户 化 的 开发 。 内 容 仓库 的 一 个 关键 特性 是 ， 不 必 关 心 数据 是 如 何 存放 
的 ， 不 考虑 数据 存放 在 数据 库 、 文 件 系统 ， 还 是 XML 文件 。 内 容 仓库 可 以 对 文 
件 进行 访问 控制 、 查 询 、 版 本 控制 、 锁 定 等 。 

由 于 市 场 上 有 许多 的 CMS 厂商 ， 他 们 的 CMS 产品 又 都 拥有 自己 的 CR 系统 。 
这 造成 了 每 个 CMS 厂商 的 CR 系统 的 API 都 不 相同 。 随 着 内 容 管理 应 用 程序 的 
日 益 普及 ， 遵 循 ECM 内 容 仓库 标 准 ， 提 供 标准 化 API 的 内 容 仓库 系统 的 需求 已 
凸现 出 来 。 为 了 解决 这 个 问题 ， 在 2005 年 ，Java 联盟 机 构 首次 提出 了 Java 内 容 
仓库 (Java Content Repository，JCR) 规范 标准 ，JCR1.0 标准 具体 由 JSR-170 指 
定 ，2009 年 10 月 ,由 JSR-283 指定 的 JCR2. 0 标准 定稿 。 

JCR 规范 的 推出 ， 打 破 了 传统 ECM 领域 技术 上 的 分 立 局 面 ， 它 的 目标 是 满 
足 行业 对 公共 的 、 标 准 的 内 容 仓 库 API 的 需求 。 它 提供 了 一 套 Java 平台 上 的 标 
准 内 容 仓 库 API， 它 位 于 应 用 系统 和 底层 存储 层 之 间 ， 使 用 树 状 节点 模型 存储 内 
容 数据 ， 并 基于 此 模型 提供 诸如 访问 粒度 控制 、 版 本 控制 、 内 容 事件 、 全 文 检 索 
和 过 波 等 内 容 服务 。 如 图 3-1 所 示 ， 内 容 仓库 抽象 了 各 类 应 用 程序 对 内 容 仓库 访 
问 的 细节 ， 人 允许 人 们 以 供应 商 中 立 的 方式 访问 任何 兼容 JSR-170/283 规范 的 仓库 
实现 ， 降 低 了 ECM 系统 的 复杂 度 ， 增 强 了 可 维护 性 ; 实现 了 内 容 访 问 与 存储 仓 
库 解 耦 ， 提 供 了 更 高 的 灵活 性 和 交换 能 力 。 因 此 ， 开 发 遵循 JCR 规范 标准 的 内 
容 仓库 将 成 为 一 种 趋势 。 


3.1.2 术语 解释 
本 章 所 用 到 的 术语 和 缩 略 词 ， 在 下 面 列 出 : 
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1) JCR， 全 称 Java Content Repository ， 即 Java 内 容 仓 库 。 

2) JSR， 全 称 Java Specification Request， 即 Java 规范 请 求 。JSR 是 指向 JCP 
提出 新 增 一 个 标准 化 技术 规范 的 正式 请 求 。 任 何人 都 可 以 提交 JSR， 以 向 Java 平 
台 增 添 新 的 API 和 服务 ，JSR 已 成 为 Java 界 的 一 个 重要 标准 。 

3) JCP， 全 称 Java Community Process ，JCP 是 一 个 开放 的 国际 组 织 ， 主 要 由 
Java 开发 者 以 及 被 授权 者 组 成 ， 职 能 是 发 展 和 更 新 Java 技术 规范 、 参 考 实 现 
(RI) 、 技 术 兼 容 包 (TCK) 。Java 技术 是 最 初 由 Sun Microsystems 公司 开发 的 ， 
JCP 对 Java 技术 规范 、 参 考 实 现 和 技术 兼容 性 包 进 行 开发 和 修订 。jJava 技术 和 
JCP 两 者 的 原创 者 都 是 Sun Microsystems 公司 。 然 而 ，JCP 已 经 由 Sun Microsys- 
tems 公司 于 1995 年 创造 Java 的 非 正 式 过 程 ， 使 有 兴趣 的 各 方 参与 定义 Java 的 特 
征 和 未 来 版 本 的 正式 过 程 。 演 进 到 如 今 有 数 百 名 来 自 世 界 各 地 Java 代表 成 员 一 
同 监督 Java 发 展 的 正式 程序 。 

4) TCK， 全 称 Technology Compatibility Kit， 即 技术 兼容 包 。 它 是 一 个 测试 
包 、 一 组 工具 和 其 他 必需 的 东西 ， 用 来 证 明 一 个 特定 的 Sun Microsystems 公司 技 
术 的 实现 是 否 与 应 用 程序 规范 兼容 或 者 是 和 否 与 Sun Microsystems 公司 和 Sun Micr- 
Osystems 公司 设计 的 参考 实现 兼容 。 

5) RI， 全 称 Reference Implementation， 即 参考 实现 。 一 般 指 基于 JSR 规范 
的 Java 代码 实现 。 

6) API， 全 称 Application Programming Interface， 即 应 用 程序 编程 接口 。 指 一 
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些 预先 定义 的 函数 或 接口 ， 目 的 是 提供 应 用 程序 与 开发 人 员 基 于 某 软件 或 硬件 的 
以 访问 一 组 例 程 的 能 力 ， 而 又 无 需 访问 源码 ， 或 理解 内 部 工作 机 制 的 细节 。 


3.1.3 ”内容 仓库 接口 标准 化 的 趋势 


在 软件 产业 的 历史 上 , 已 多 次 看 到 接口 标准 化 这 个 创新 、 快 速 的 适应 模式 所 
带 来 的 利益 。 接 口 标准 化 能 带 给 应 用 程序 开发 人 员 ， 项 目 经 理 很 多 好 处 ， 可 以 减 
少 提供 工具 、 培 训 和 基础 设施 的 成 本 。 企 业 软 件 的 消费 者 ， 基 于 他 们 的 最 佳 利 
益 ， 会 更 倾向 于 生产 基于 标准 架构 的 厂商 ， 而 不 是 那些 依然 把 他 们 的 软件 孤立 的 
厂商 。 

一 段 时 间 以 来 市 场 上 出 现 了 各 个 厂商 开发 的 不 同 的 ECM 系统 ， 这 些 系 统 都 
建立 在 他 们 各 自 的 内 容 仓库 之 上 。 问 题 出 现 了 ， 每 个 开发 商都 提供 了 他 们 自己 的 
API 来 访问 内 容 仓 库 。 这 对 应 用 程序 的 开发 者 带 来 了 困扰 ， 因 为 他 们 要 学 习 不 同 
开发 商 提 供 的 API， 同 时 ， 他 们 的 代码 也 与 这 些 特 定 的 API 产生 了 绑 定 。 

随 着 各 个 厂商 各 自 的 内 容 仓 库 实现 数量 的 增长 ， 人 们 越 来 越 需要 一 组 通用 的 
编程 接口 来 使 用 这 些 内 容 仓 库 ，JSR-170 正 是 为 解决 这 一 问题 而 出 现 的 ， 它 提供 
了 一 套 标 准 的 API 来 访问 任何 数据 仓库 。 通 过 JSR-170 ， 开 发 代码 只 需要 引用 ja- 
vax. jcr. * 这 些 类 和 接口 ， 就 可 以 适用 于 任何 兼容 JSR-170 规范 的 内 容 仓库 。 

可 以 把 JSR-170 理解 为 和 JDBC 类 似 的 API， 这 样 就 可 以 不 依赖 任何 具体 的 
内 容 仓库 实现 来 开发 应 用 程序 。 可 以 直接 使 用 支持 JSR-170 的 内 容 仓库 ， 或 者 如 
果 一 些 厂商 的 内 容 仓 库 不 支持 JSR-170， 那 么 可 以 通过 这 些 厂商 提供 的 JSR-170 
驱动 来 完成 从 JSR-170 与 厂商 特定 的 内 容 仓 库 的 转换 。 

另外 ， 一 个 可 用 的 接口 标准 ， 会 大 大 鼓励 发 展 独 立 的 咨询 和 培训 方案 。 相 关 
内 置 支持 接口 的 软件 开发 工具 会 很 快 跟 进 ， 从 而 促进 附加 应 用 程序 的 接口 的 使 
用 。 基 于 一 个 基础 设施 软件 的 众多 应 用 程序 的 发 展 ， 会 远 远 超过 任何 单一 的 应 用 
程序 的 市 场 价 值 ， 将 成 为 一 个 性 能 优化 关注 的 重点 。 






































3.2 Java 内 容 仓库 API 


JCR 规范 是 在 JCP 中 作为 JSR-170 开发 的 ， 它 的 目标 是 满足 这 些 行业 的 需 
求 。 该 规范 在 javax. jcr 命名 空间 中 提供 了 统一 的 API， 人 允许 人 们 以 厂商 中 立 的 方 
式 访问 任何 符合 规范 的 仓库 实现 。 

但 是 API 标准 化 并 不 是 Java 内 容 仓 库 带 来 的 唯一 特性 。JSR-170 的 一 个 主要 
优势 就 是 没有 捆绑 到 任何 特定 的 底层 架构 上 。 例 如 ，JSR-170 实现 的 后 端 数据 存 
储 可 以 是 文件 系统 、WebDAYV 仓库 、XML 支持 的 系统 ， 甚 至 还 可 以 是 SQL 数据 
库 。 而 且 ，JSR-170 的 导出 和 导入 功能 允许 集成 人 员 在 后 端 内 容 和 JCR 实现 之 间 
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无 颖 地 切换 。 最 后 ，JCR 提供 了 一 个 简单 直观 的 接口 界面 ， 可 以 将 该 接口 放 在 各 
种 现 有 的 内 容 仓库 之 上 ， 并 同时 标准 化 一 些 复杂 的 功能 ， 例 如 版 本 管理 、 访 问 控 
制 和 搜索 等 。 

在 讨论 JCR 时 ， 有 几 种 方式 可 以 采用 。 在 这 里 ， 我 们 从 开发 人 员 的 角度 来 
研究 JSR-170 规范 所 提供 的 特性 ， 重 点 放 在 可 用 的 API 和 接口 上 ， 这 些 接口 允许 
程序 员 在 设计 内 容 应 用 程序 时 有 效 利用 JSR-170 仓库 。 

内 容 仓 库 API 的 内 容 存 储 和 高 效 检索 分 离 的 问题 ， 涉 及 应 用 程序 开发 人 员 定 
义 的 内 容 是 如 何 确 定 通过 接口 ， 写 和 内容 ,然后 使 用 内 置 服务 的 API 来 执行 多 种 
模式 的 高 效 检索 、 读 、 相 关 数 据 的 遍历 、 分 层 搜索 和 完整 的 数据 库 查 询 。 真 正 的 
存储 格式 与 应 用 程序 之 间 的 交互 是 分 离 的 ， 而 不 是 在 应 用 程序 的 设计 早期 过 早 决 
定 选择 最 合适 的 存储 子 系统 。 应 用 程序 开发 人 员 不 必 担 心 文件 格式 的 解析 、 文 本 
内 容 的 搜索 索引 维持 、 事 务 管 理 ， 或 应 用 程序 之 间 的 数据 导出 ， 内 容 服务 可 以 向 
那些 非特 定 的 应 用 程序 提供 了 一 个 仓库 API。JCR 通过 一 个 通用 的 、 分 层 的 数据 
模型 ， 基 于 可 扩展 的 节点 类 型 和 内 容 属 性 ， 功 能 级 别 区 分 只 读 或 读 / 写 资料 库 ， 
并 为 更 高 层次 的 内 容 提供 可 选 功能 服务 。 


3.2.1 JSR-170 规范 


JCR 标准 打破 了 传统 ECM 领域 技术 上 的 分 立 局 面 ， 提 供 了 一 套 Java 平台 上 
的 标准 内 容 仓库 API 规范 ， 此 规范 定义 树 状 节点 模型 存储 内 容 数据 ， 并 提出 基于 
此 模型 的 诸如 访问 粒度 控制 、 版 本 控制 、 内 容 事件 、 全 文 检索 和 过 滤 等 服务 功 
能 。 它 抽象 了 应 用 程序 对 内 容 仓库 访问 的 细节 ， 人 允许 人 们 以 供应 商 中 立 的 方式 访 
问 任何 兼容 JSR-170/283 规范 的 仓库 实现 。 

JSR-170 定义 了 一 套 访问 内 容 仓 库 的 标准 API，JSR-170 抽象 地 定义 了 内 容 
数据 的 存储 和 应 用 系统 的 数据 获取 的 细节 ， 以 便 多 个 应 用 使 用 一 个 统一 的 接口 来 
实现 不 同 的 目的 而 没有 明显 的 性 能 降级 。JSR-170 是 JCR1.0 标准 ; JSR-283 是 
JCR2. 0 标准 。JSR-170/283 规范 共同 定义 了 对 内 容 仓 库 的 编程 接口 。JSR-283 的 

架构 和 JSR-170 相同 ， 仅 增加 了 一 些 API。JSR-170/283 提供 API 包 javax. jcr *， 

此 包 定 义 了 以 上 各 层 的 接口 。 通 过 包 javax. jcr. * 中 的 类 和 接口 可 以 访问 所 有 兼 
容 JSR-170 的 内 容 仓库 。 内 容 仓 库 的 数据 存储 方式 可 以 是 数据 库 或 者 文件 系统 或 
者 是 两 者 的 混合 ，JSR-170 将 个 性 化 应 用 与 内 容 的 实际 存储 隔离 开 ， 后 端的 存储 
模式 可 以 为 关系 数据 库 、XML 或 任意 对 象 数据 库 ， 如 图 3-2 所 示 。 

从 逻辑 上 来 看 ，JSR-170 将 内 容 仓库 划分 成 多 个 工作 空间 (workspace ) ， 
个 工作 空间 以 树 形 结构 来 组 织 。 节 点 和 属性 构成 工作 空间 要 素 ， 
矩形 代表 属性 。 每 个 工作 空间 都 有 一 个 root 节点 ，root 节点 是 工作 空间 的 根 节 
点 ， 数 据 保存 在 必 性 中 。 
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个 性 化 应 用 
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图 3-2 JSR-170 在 应 用 与 存储 之 间 的 隔离 
JSR-170/283 将 实现 划分 成 3 个 层次 ,任何 实现 JSR-170/283 的 内 容 仓库 ， 


javax .jcr(JSR—170) 
专 有 API CR3 


对 象 数据 库 


javax .jcr(JSR—170) 
专 有 API CR1 


关系 数据 库 

















可 以 选择 实现 全 部 或 者 一 部 分 ， 具 体 每 个 级 别 的 内 容 和 说 明 ， 在 下 一 节 介 绍 。 
3.2.2 JSR-170 的 兼容 级 别 











为 了 使 各 个 厂商 能 更 容易 地 实现 JCR，JSR-170 规范 提供 了 两 个 兼容 级 别 和 








一 组 额外 的 可 选 功能 ,任何 级 别 的 仓库 都 可 能 支持 可 选 功能 。 级 别 1 提供 只 读 功 


公 


月 


已 
已 ， 


级 别 2 级 在 级 别 1 的 基础 上 ， 增 加 了 额外 的 写 功能 ， 具 体 功能 分 工 如 下 : 
1) 级 别 1: 定义 了 一 个 只 读 的 内 容 人 仓库， 包括: 

Qa 检索 和 遍历 节点 和 属性 。 

@) 读 取 属 性 的 值 。 

@) 瞬 态 命名 空间 重 映射 。 

@ 导出 到 XML/SAX。 

@ 方便 的 XPath 语法 查询 。 

GO 发 现 可 用 的 节点 类 型 。 

@ 发 现 访问 控制 权限 。 

2) 级 别 2: 定义 了 一 个 可 写 的 内 容 仓库 ， 添 加 了 : 

@ 添加 和 删除 节点 与 属性 。 

G@) 写 属 性 的 值 。 

@) 持久 化 命名 空间 改变 。 

@ 从 XML/SAX 中 导入 。 

@) 给 节点 分 配 节 点 类 型 。 

3) 可 选 功能 : 定义 了 五 种 附加 功能 的 实现 ， 以 下 五 种 附加 功能 的 任何 组 
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合 ， 可 以 添加 到 任何 级 别 的 实现 上 : 
Q 事务 。 
@ 版 本 。 
@) 观察 (事件 ) 。 
@ 锁定 。 
@ SQL 语法 查询 。 
3.2.3 JSR-170 的 优点 


JSR-170 把 自己 定义 为 一 个 能 与 内 容 仓库 互相 访问 的 、 独 立 的 、 标 准 的 方 
式 。 同 时 它 也 对 内 容 仓库 做 出 了 自己 的 定义 ， 它 认为 内 容 仓库 是 一 个 高 级 的 信息 
管理 系统 ， 该 系统 是 传统 的 数据 仓库 的 扩展 ， 它 提供 了 诸如 版 本 控制 、 全 文 检 
索 、 访 问 控制 、 内 容 分 类 、 访 问 控制 、 内 容 事件 监视 等 内 容 服务 。 

JSR-170 API 对 不 同 的 人 员 提供 了 不 同 的 好 处 ， 具 有 如 下 优点 : 

1) 开发 人 员 : 有 了 标准 ， 开 发 者 无 需 了 解 厂商 仓库 特定 的 API， 只 要 兼容 
JSR-170 就 可 以 通过 JSR-170 访问 其 仓库 应 用 程序 。 开 发 人 员 可 以 放心 地 使 用 一 
个 标准 接口 ， 作 为 应 用 程序 的 基础 ， 而 无 需 担 心 被 任何 单一 供应 商 锁定 。 该 标准 
接口 允许 应 用 程序 从 一 个 内 容 仓库 被 移植 到 另 一 个 内 容 仓库 的 实现 ， 可 以 在 任何 
系统 上 提供 该 应 用 程序 的 最 大 价值 。 除 此 之 外 ， 标 准 还 促进 了 开发 商 拥 有 共同 的 
词汇 ， 使 得 它 更 容易 地 表达 设计 思想 和 潜在 的 实现 ， 并 消除 了 需要 学 习 几 十 个 专 
有 的 API 到 具体 的 每 个 应 用 程序 的 代价 。 

2) 软件 项 目 经 理 : 项 目 经 理 采用 标准 化 来 减少 在 项 目 规划 中 的 风险 。 使 用 
一 个 通用 的 标准 接口 ， 可 以 推广 经 验 和 重用 代码 ， 降 低 未 来 的 成 本 ， 使 其 更 容易 
地 根据 过 去 的 经 验 估计 未 来 项 目 。 同 样 ， 采 用 的 技术 可 以 由 多 个 供应 商 的 支持 而 
减少 风险 ， 项 目 将 不 依赖 于 任何 单一 的 供应 商 。 一 个 内 容 仓库 的 标准 将 使 项 目 经 
理 更 容易 地 比较 来 自 多 个 供应 商 的 资料 库 ， 更 好 地 适应 当前 的 应 用 程序 ， 同 时 ， 
提供 了 更 大 的 投资 回报 ， 却 没有 被 限制 在 一 个 单一 的 目的 。 

3) 开发 商 : 对 于 开发 使 用 ECMS 的 公司 ,无 需 花 费 资金 用 于 在 不 同 种 类 
CMS 的 内 容 仓 库 之 间 进 行 转换 ， 也 无 需 自 己 开发 内 容 仓库 ,而 只 需要 专注 于 开 
发 ECM 的 应 用 。 

4) 使 用 者 : 对 于 使 用 者 而 言 ， 则 无 需 花 费 资金 用 于 在 不 同 种 类 ECM 的 内 
容 仓 库 之 间 进 行 转换 ， 降 低 了 总 投入 成 本 。 


3.3 仓库 模型 


















































JCR 的 核心 是 其 为 仓库 接口 所 定义 的 数据 模型 ， 称 之 为 仓库 模型 。 仓 库 模 型 
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定义 了 从 客户 端的 角度 来 看 ， 仓 库 内 的 对 象 是 如 何 识别 和 结构 化 存放 。 当 客户 端 
希望 对 数据 进行 操作 ， 它 体现 这 些 行动 对 仓库 模型 的 一 系列 影响 。 


3.3.1 仓库 模型 结构 


在 JCR 规范 中 ， 一 个 内 容 仓库 是 由 一 个 或 多 个 工作 空间 (workspace) 组 成 
人 工作 空间 里 面 应 该 存放 相似 的 内 容 。 从 逻辑 上 看 ， 仓 库 模 型 是 一 个 简单 的 层 

结构 ， 看 起 来 很 像 一 棵 n 层 的 树 。 每 个 工作 空间 包含 一 棵 条 目 (items) 树 ， 
Si 个 独立 的 根 (root) 节点 ， 下面 是 一 些 条 目 (items); 条 目 既 可 以 是 节点 
(node) ， 也 可 以 是 属性 (property ) 。 每 个 节点 可 以 具有 零 个 或 多 个 子 节 点 
(child node) ， 以 及 零 个 或 多 个 子 属性 (child property) 。 除 了 根 节点 ， 其 他 节点 
都 有 一 个 父 节 点 ， 属 性 有 一 个 父 属 性 ， 但 不 能 有 子 节点 或 子 属 性 ， 属 性 是 树 的 叶 
子 ， 所 有 实际 的 内 容 就 存储 在 属性 的 值 中 。 

这 个 结构 如 图 3-3 所 示 。 同 圈 代 表 节 点 ， 和 矩形 代表 属性 。 请 参见 节点 A、B 
和 C， 它 们 都 衍生 自 一 个 根 节 点 。 节 点 A 有 两 个 属性 ， 即 一 个 字符 串 “John” 和 
一 个 整数 22。 




















图 3-3 一 个 具有 多 个 工作 空间 的 仓库 模型 结构 


图 3-4 表示 了 一 个 工作 空间 的 仓库 模型 。 此 工作 空间 包含 一 个 单 根 节 点 与 子 
节点 a、b 和 c， 其 中 每 一 个 都 有 进一步 的 子 节 点 或 属性 。 例 如 ， 节 点 a 有 两 个 子 
节点 4 和 e。 反 过 来 ， 节 点 e 有 两 个 属性 j 和 kk。 属 性 j 包含 一 个 图 像 (兔子 的 图 
片 ) 和 k (包含 一 个 浮 点 数 ，6. 022 x 103 ) 。 同 样 ， 属 性 站 包含 一 个 布尔 值 
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(true) ， 属 性 g 包含 一 个 字符 串 (“Once upon a time. .. ”) ， 属 性 h 包含 一 个 整数 
. 中 | 
2 h 
a time... 


图 3-4 一 个 只 有 单个 工作 空 间 的 仓库 模型 


在 层次 结构 中 的 任何 条 目 ， 可 以 由 一 个 绝对 路 径 确定 。 例 如 ， 路 径 / 指 到 根 
节点 ， 路 径 /a/d/i 指向 值 为 true 的 属性 。 绝 对 路 径 总 是 以 一 个 “/ ”字符 开始 。 
相对 路 径 指 定 一 个 节点 或 属性 与 在 层次 结构 中 男 一 个 位 置 的 相对 性 。 例 如 ， 
相对 于 图 3-4 中 的 节点 /a， 值 为 true 的 属性 的 路 径 是 d/i。 还 支持 UNIX 风格 的 
路 径 段 ,“. ”和 “.. ”分 别 代 表 “ 当 前 ”和 “ 父 ”。 这 样 ， 相 对 于 Aa， 包含 值 


-25 的 属 性 的 相对 路 生 到 是 . . /ce/h。 相 对 路 径 有 别 于 绝对 路 径 ， 相 对 路 径 没有 开 
始 的 “/” 字 符 。 














3.3.2 工作 空间 


一 个 内 容 仓 库 由 一 定数 量 的 工作 空间 组 成 。 每 个 工作 空间 包含 一 个 单一 的 条 
目 根 树 。 在 最 简单 的 情况 下 ， 一 个 仓库 将 只 包括 一 个 工作 空间 。 在 更 复杂 的 情况 
一 个 仓库 将 由 多 个 工作 空间 组 成 。 
J 单个 工作 空间 仓库 
只 有 一 个 工作 空间 的 仓库 ， 由 一 个 单一 的 节点 和 属性 树 组 成 。 图 3-5 所 
ai 就 描述 了 一 个 工作 空间 的 内 容 仓 库 。 
由 于 一 个 给 定 的 工作 空间 包含 一 个 节点 与 一 个 给 定 的 UUID (通用 唯一 识别 
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码 )， 在 这 种 情况 下 ， 作 为 一 个 整体 ， 至 多 有 一 个 给 定 的 UUID 的 节点 在 库 中 。 

图 3-5 中 ,小 圆圈 代表 节点 ， 篆 涉 从 内容 仓库 
父 节 点 指向 子 节 点 ， 并 用 子 的 名 字 标 记 。 
根 节点 的 名 称 实际 上 是 空 字符 串 ， 虽 然 为 
清晰 ， 它 显示 字符 串 “ [root]”。 和 节点 内 
的 数字 表示 节点 的 UUID。 例 如 ， 根 节点 / 
的 UUID 是 00， 节 点 [axd 的 UUID 是 03 ， 
节点 /ave 不 是 可 引用 的 ， 因 此 没有 一 个 
UUID 。 
3.3.2.2 多 个 工作 空间 和 相应 的 节点 

在 一 个 有 多 个 工作 空间 的 仓库 中 ,在 

一 个 工作 空间 中 的 节点 可 能 有 其 他 工作 空 
间 中 的 相应 节点 。 一 个 节点 的 相应 节点 的 2 
定义 如 下 ， 空间 的 仓库 模型 

1) 一 个 节点 的 相应 节点 是 那些 具有 相同 的 对 应 标识 符 的 节点 。 

2) 一 个 引用 节点 的 对 应 标识 符 是 其 UUID。 

ed Wee 应 标识 符 ， 是 由 一 对 

近 的 引用 的 祖先 和 相对 路 径 的 UUID 组 成 。 

0 它 的 对 应 标识 符 是 它 的 
绝对 路 径 。 

如 果 一 个 仓库 有 一 个 引用 的 根 节点 的 工作 区 ， 则 其 所 有 工作 区 必须 要 有 引用 
的 根 节 点 ， 并 且 这 些 根 节点 都 必须 有 相同 的 UUID。 

除了 具有 相同 的 对 应 标识 符 ， 相 应 的 节点 没有 别 的 共同 点 。 它 们 可 以 有 完全 
不 同 的 属性 和 子 节 点 。 请 注意 ， 在 每 个 工作 空间 中 ， 针 对 给 定 的 UUID， 仍然 最 
多 有 一 个 节点 。 
3.3.2.3 一 个 示例 

图 3-6 所 示 为 具有 两 个 工作 空间 的 仓库 的 原理 。 

在 这 里 ,我 们 看 到 了 两 个 工作 空间 : WS1 和 WS2。 虚 线 表示 相应 的 节点 。 
例如 ，WS1 中 的 节点 /a 对 应 WS2 中 的 节点 Lm， 因 为 双方 都 有 一 个 01 的 UUID。 
同样 ，WS1 中 的 节点 Lb 对 应 WS2 中 的 节点 Ab。 在 这 些 情况 下 ， 因 为 节点 是 可 以 
引用 的 ， 在 确定 它们 的 相关 性 上 ， 这 些 路 径 和 名 称 并 不 相关 。 

另 一 方面 ，WS1 中 的 [ave 对 应 WS2 中 的 m/c， 因 为 它们 都 有 相同 的 相对 路 
径 ， 即 ce， 从 它们 最 近 的 引用 祖先 ， 即 分 别 在 WS1 和 WS2 中 的 /a 和 /m。 

注意 ， 也 可 以 有 只 在 一 个 工作 空间 的 节点 ， 而 不 存在 其 他 的 工作 区 间 。 比 如 
WS1 中 的 /a/d。 


















工作 空间 
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属性 有 且 只 有 一 个 父 节点 。 







工作 空间 1 
(WS1) 


工作 空间 2 
(WS2) 




















图 3-6 具有 两 个 工作 空间 的 仓库 模型 


节点 、 属 性 和 条 目 




















图 3-7 节点 、 属 性 和 条 目 之 间 的 接口 关系 图 











eeu 属性 有 一 些 共同 的 功能 ， 在 接口 条 目 中 定义 常用 的 方法 ， 子 接口 
节点 和 属性 进一步 增加 更 多 的 方法 。 图 3-7 总 结 了 接口 之 间 的 基本 关系 。 


此 UML (统一 建 模 语言 图 表示 属性 和 节点 是 条 目的 子 接口 。 一 个 单一 的 
一 个 节点 可 以 具有 零 父 节点 〈 仅 当 它 是 根 节 点 ) 或 
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一 个 父 节 点 。 一 个 节点 可 以 有 任意 数目 的 子 项 对 象 ， 即 属性 或 节点 对 象 。 
4 节点 类 型 


每 个 节点 必须 有 且 只 有 一 个 主 节 点 类 型 。 主 节点 类 型 定义 名 称 、 类 型 ， 以 及 
其 他 的 一 个 节点 被 允许 有 的 属性 和 子 节点 的 特征 。 每 个 节点 都 有 一 个 特殊 的 属 
性 ， 称 为 jcr， primaryType， 它 记录 其 主 节点 类 型 的 名 称 。 

除了 主 节点 类 型 之 外 ， 节 点 还 可 以 有 一 个 或 多 个 混合 类 型 。 混 合 类 型 很 像 修 
饰 器 ， 为 节点 提供 额外 的 特征 。 具 体 来 说 ，JCR 实现 可 以 提供 三 种 预定 义 的 混合 
类 型 ; 

1) mix: versionable: 允许 节点 文 持 版 本 管理 。 

2) mix: lockable: 支持 节点 的 锁定 功能 。 

3) mix: referenceable: 提供 一 个 自动 创建 的 jer: uuid 属性 ， 该 属性 给 节点 
一 个 唯一 的 、 可 引用 的 标识 符 。 

该 规范 还 提供 了 一 组 预定 义 的 主要 和 混合 节点 类 型 ， 一 些 是 必须 的 ,一 些 是 
可 选 的 。 在 JCR 规范 的 级 别 1 提供 发 现 现 有 节点 的 节点 类 型 的 方法 ， 以 及 发 现 
和 读 取 库 中 可 用 节点 类 型 定义 的 方法 。 在 规范 的 级 别 2 中 ， 提 供给 节点 分 配 主 要 
和 混合 节点 类 型 的 方法 。 但 该 规范 并 不 试图 提供 定义 、 创 建 或 管理 主要 或 混合 节 
点 类 型 的 方法 。 


3.3.5 命名 空间 


仓库 模型 的 一 个 有 用 却 常 被 忽视 的 特性 是 它 对 命名 空间 (namespace) 的 支 
寺 。 命 名 空间 防止 来 自 不 同 来 源 和 不 同 应 用 程序 域 的 条 目 和 节点 类 型 之 间 出 现 命 


3. 3. 






































名 冲突 。 命 名 空间 利用 一 个 前 组 进行 定义 ， 中 间 由 一 个 “:”( 冒 号 ) 字符 分 隔 。 
一 个 节点 或 属性 的 名 称 可 能 有 一 个 前 级 ， 由 “:”( 冒 号) 字符 分 隔 ， 表 示 该 条 
目 所 在 的 命名 空间 。 


一 个 内 容 仓 库 的 命名 空间 是 仿照 XML 中 的 命名 空间 。 在 XML 中 ， 前 绥 实 
际 上 是 完整 的 命名 空间 ， 这 是 一 个 URI (统一 资源 定位 符 ) 的 简写 。 使 用 URI 
作为 命名 空间 ， 以 尽量 减少 命名 冲突 。 每 个 兼容 仓库 ， 级 别 1 或 2， 都 有 一 个 
命名 空间 的 注册 表 。 命 名 空间 注册 表 中 始终 包含 至 少 以 下 内 置 的 命名 空间 
前 绥 

1) jer 为 使 用 内 置 的 节点 类 型 定义 的 条 目 保 留 。 

2) nt 为 内 置 的 主 节点 类 型 的 名 称 保留 。 

3) mix 为 内 置 的 混合 节点 类 型 的 名 称 保留 。 

4) xml 为 与 XML 兼容 的 原因 保留 。 

5) "(空前 级 ) 表示 默认 的 命名 空间 。 
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3.3.6 名 称 与 路 径 


在 JCR 规范 中 的 一 个 “名 称 ” 是 一 个 没有 任何 方 括号 索引 的 路 径 元 素 。 例 
如 ，myapp: paragraph 就 代表 一 个 名 称 和 一 个 有 效 的 相对 路 径 (深度 为 1)， 而 
myapp: paragraph [3] 不 是 一 个 名 称 ， 它 仅仅 是 一 个 相对 路 径 。 

名 称 和 路 径 不 是 具有 一 定 的 语法 的 简单 字符 串 。 它 们 有 特殊 的 语义 ， 它 们 代 
表 当 前 会 话 的 命名 空间 映射 。 提 供 的 特殊 属性 类 型 NAME 和 PATH 使 这 些 值 以 
一 种 命名 空间 敏感 的 方式 存储 在 一 个 仓库 中 。 


3.3.7 属性 


每 个 属性 是 以 下 类 型 之 一 : 

1) PropertyType. STRINC。 

2) PropertyType. BINARY, 

3) PropertyType. DATE 。 

4) PropertyType. LONC 。 

5) PropertyType. DOUBLE。 

6) PropertyType. BOOLEAN, 

7) PropertyType. NAME, 

8) PropertyType. PATH。 

9) PropertyType. REFERENCE。 

在 级 别 1 ( 读 ) 和 级 别 2 ( 写 )， 提 供 适 当 的 方法 ,来 实现 本 地 Java 类 
型 与 仓库 属性 值 之 间 的 读 或 写 。 比 如 ， 值 PropertyType. STRING 可 以 作为 ja- 
va. lang. String 对 象 读 写 ， 值 PropertyType. LONG 可 以 对 应 Java long 变 
量 等 。 
3.3.7.1 多 值 属性 

在 某 些 情况 下 ， 属 性 可 能 有 多 个 值 。 一 个 可 能 有 多 个 值 的 属性 ， 不 论 是 有 一 
个 或 多 个 值 ， 被 称 为 多 值 属性 。 一 个 特定 的 属性 是 否 是 一 个 多 值 属 性 ， 是 由 适用 
于 它 的 属性 定义 的 ， 也 就 是 由 属性 的 父 节 点 的 节点 类 型 确定 。 

一 个 多 值 属 性 的 值 是 有 序 的。 使 用 方法 Property. getValues ， 可 以 访问 这 样 的 
属性 值 ， 它 返回 一 个 值 对 象 数组 ， 包 含 按 其 规定 的 顺序 值 。 

如 果 使 用 Property. getValue 访问 一 个 多 值 属性 ， 或 使 用 Property. getValues 访 
问 单 值 属性 ， 将 抛 出 一 个 ValueFormatException 异常 。 

与 数组 值 约束 类 似 ， 在 一 个 多 值 属性 中 存储 的 值 ， 必 须 都 是 相同 类 型 的 。 如 
果 在 一 个 多 值 属性 的 值 被 设置 为 auall， 这 相当 于 从 值 数 组 中 删除 。 在 这 种 情况 
下 ， 数 组 会 自动 压缩 ， 索 引 值 会 自动 -1 。 
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3.3.7.2 引用 、 路 径 和 名 称 属性 类 型 

三 个 属性 类 型 有 特殊 的 语义 : 引用 、 路 径 和 名 称 。 

一 个 名 称 属 性 ， 用 于 存储 命名 空间 限定 的 字符 串 。 比 如 节点 类 型 的 名 字 或 
仓库 条 目的 名 称 。 一 个 名 称 属性 ， 可 以 作为 一 个 命名 空间 识别 的 字符 串 ， 可 以 
类 似 字 符 串 一 样 被 设置 (例如 ，setProperty (“aNodeType”, “nt: fle”))。 然 
而 ， 前 绥 被 自动 映射 到 其 当前 的 URI， 值 使 用 完整 的 命名 空间 URI 存储 。 当 以 
后 读 属性 时 ,映射 被 扭转 ， 如 果 有 问题 的 URI 已 重新 映射 ， 在 返回 的 值 反 映 
了 重 映 。 

一 个 路 径 属性 ， 代 表 在 工作 空间 的 路 径 (相对 或 绝对 ) ， 因 此 也 可 以 用 来 引 
用 在 工作 空间 中 其 他 地 方 的 条 目 。 然 而 ， 路 径 属性 不 强制 参照 完整 性 ， 换 句 话 
说 ， 它 可 以 指向 一 个 位 置 , 但 目前 没有 条 目 存 在 。 

一 个 引用 属性 ， 是 用 来 提供 一 个 在 工作 空间 中 其 他 地 方 的 节点 的 命名 参考 。 
该 属性 的 值 是 它 参 考 节点 的 UUID。 因 此 ， 只 有 引用 的 节点 可 以 是 参考 属性 的 目 
标 。 引 用 属性 有 保持 参照 完整 性 的 额外 语义 特征 ， 这 可 以 防止 任何 目前 的 参考 属 
性 的 目标 节点 被 删除 。 要 删除 一 个 节点 ， 此 节点 是 当前 一 个 引用 的 目标 ， 那 么 必 
须 先 删除 引用 。 当 试图 持久 性 去 除 一 个 节点 时 ， 会 激活 参照 完整 性 检查 。 可 以 使 
用 方法 Node. getReferences () 来 寻找 指向 一 个 特定 节点 的 所 有 引用 属性 。 使 用 
方法 Node. setProperty (String name，Node value) 来 设置 到 指定 节点 的 UUID 的 参 
考 属性 值 。 
3.3.7.3 没有 空 值 

每 个 属性 必须 有 一 个 值 。 属 性 状态 的 范围 不 包括 “null value” 或 “no value”。 
设置 一 个 属性 为 “null” 就 相当 于 删除 这 个 属性 。 在 多 值 属性 的 情况 下 ， 数 组 内 
的 一 个 特定 值 设 置 为 null， 意 味 着 删除 这 个 值 ， 并 压缩 数组 。 因 此 ， 可 能 存在 一 
个 多 值 的 属性 ， 但 没有 值 ， 即 一 个 空 数组 。 






































3.4 ”级 别 1 仓库 功能 











JCR 的 级 别 1 定义 了 一 个 最 简单 的 内 容 仓 库 ， 只 支持 只 读 访问 。 这 使 人 们 有 
可 能 快速 部 署 有 相当 数量 的 基本 实现 ， 特 别 是 在 那些 内 容 存储 在 传统 的 平台 中 ， 
而 应 用 的 需求 只 需要 提供 只 读 访 问 的 情况 ; 此 外 ， 级 别 1 包括 支持 通过 XML 的 
导出 ， 人 允许 迁移 内 容 到 其 他 平台 或 级 别 2 的 资料 库 。 

级 别 1 的 功能 与 级 别 2 或 支持 可 选 功能 的 仓库 相 比 ， 会 有 所 不 同 。 由 于 级 
别 2 是 级 别 1 的 超 集 ， 符 合 级 别 1 规范 的 任何 要 求 会 自动 被 级 别 2 遵守 ， 
此 ， 本 节 内 容 也 适用 于 级 别 2 的 实现 。 以 下 部 分 说 明 级 别 1 功能 基础 上 
的 API。 
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3.4.1 访问 仓库 


访问 内 容 仓库 的 入 口 点 是 Repository 对 象 ， 一 般 通 过 Java 命名 和 目录 接口 
(Java Naming and Directory Interface ，JNDI) API 来 获得 。 一 个 客户 端 使 用 工作 空 
间 的 名 称 和 凭据 ， 通 过 调用 一 个 Repository 对 象 的 login 方法 ， 可 以 登录 到 内 容 仓 
库 的 一 个 工作 空间 中 ， 即 启动 一 个 会 话 (Session) ，login 方法 如 下 所 示 : 

Session login (Credentials credentials, String workspaceName ) 

如 果 登 录 成 功 ， 客 户 端 会 接收 到 一 个 绑 定 到 指定 工作 空间 (根据 客户 端的 
凭据 过 滤 ) 的 会 话 ; 客户 端 可 以 访问 工作 空间 内 的 任何 节点 或 属性 ， 只 要 对 它 
们 的 访问 是 会 话 登 录 授权 的 ， 并 能 在 执行 动作 之 前 确定 它 是 否 有 权限 执行 一 个 给 
定 的 动作 。 一 个 内 容 仓库 可 以 定义 自己 的 访问 控制 系统 ， 或 使 用 一 个 外 部 机 制 ， 
如 Java 验证 和 授权 服务 (Java Authentication Authorization Service，JAAS)。 

还 可 以 使 用 Repository. getDescriptorKeys 和 Repository. getDescriptor 方法 查询 
有 关 特 定 仓 库 实 现 的 信息 ， 方 法 说 明 如 下 : 

String [|] getDescriptorKeys () 

此 方法 返回 一 个 字符 串 数组 ， 包 含 此 实现 提供 的 所 有 摘 述 键 。 必 须 至 少 包含 
在 此 接口 中 定义 的 字符 串 常量 键 。 与 Repository. getDescriptor (字符 串 名 称 ) 方 

法 结合 使 用 ， 来 查询 有 关 这 个 仓库 实现 的 信息 。 


3.4.2 读 取 仓库 内 容 


读 取 仓 库 内 容 的 操作 ， 涉 及 访问 节点 (直接 或 通过 遍历 层次 ) 和 读 取 属 性 
的 值 。 

由 方法 Repository. login 返回 的 会 话 对 象 ， 封 装 了 一 个 特定 用 户 的 授权 设置 和 
指定 的 工作 空间 绑 定 。 一 旦 获得 一 个 会 话 ， 客 户 端 就 可 以 通过 三 种 方式 来 检索 工 
作 空间 的 内 容 。 

1) 通过 遍历 树 。 

2) 通过 直接 访问 特定 的 节点 。 

3) 通过 遍历 一 系列 的 查询 结果 集 。 

每 个 会 话 对 象 一 对 一 关联 到 一 个 工作 空间 对 象 。 工 作 空间 对 象 代表 一 个 实际 
仓库 工作 空间 实体 的 视图 ， 通 过 其 相关 会 话 的 授权 设置 。 

在 关联 到 一 个 特定 会 话 的 工作 空间 对 象 实例 ， 以 及 与 一 个 实际 工作 空间 实体 
之 间 ， 有 一 个 重要 的 区 别 。 如 果 访 问 某 个 特定 的 工作 空间 的 多 个 会 话 ， 即 使 所 有 
这 些 工作 空间 对 象 可 能 代表 库 中 同一 实际 工作 空间 实体 ， 那 么 每 个 会 话 还 都 将 拥 
有 自己 的 工作 空间 对 象 。 换 句 话 说， 一 个 工作 空间 对 象 对 应 一 个 特定 工作 空间 实 
体 的 视图 ， 这 个 视图 是 由 关联 到 工作 空间 对 象 的 会 话 来 决定 。 
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另 一 方面 ， 每 个 会 话 对 象 代表 一 个 单独 的 会 话 实体 。 两 个 或 多 个 会 话 实 例 可 
以 存在 相同 的 凭据 和 相同 的 工作 空间 名 称 ， 但 仍然 有 不 同 的 状态 。 

由 于 会 话 和 工作 空间 实例 总 是 一 对 一 的 关联 ， 从 逻辑 上 看 ， 结 合成 一 个 单 
的 对 象 。 然 而 ， 这 两 个 对 象 之 间 的 区 别 在 级 别 2 中 实现 ， 仓 库 的 写 和 可 以 以 两 种 
方式 发 生 ,， 或 者 是 通过 临时 存储 (关联 到 会 话 对 象 )， 或 者 是 直接 写作 到 持久 层 
(关联 到 工作 空间 对 象 ) 。 在 级 别 1 中 维护 它 ， 主 要 是 为 了 区 分 这 两 种 对 象 之 间 
写 模式 的 区 别 。 

在 实现 级 别 1 的 仓库 中 ,会话 和 工作 空间 对 象 之 间 的 区 别 并 不 发 挥 重要 作 
用 。 它 的 存在 只 是 为 了 与 级 别 2 的 兼容 性 。 
3.4.2.1 会 话 的 读 方 法 
通过 以 下 方法 ， 可 以 读 取 关联 到 一 个 仓库 的 会 话 的 访问 信息 和 从 会 话 的 工作 
空间 访问 内 容 信息 。 会 话 还 有 其 他 方法 ， 在 级 别 2 中 涉及 ， 在 级 别 1 的 实现 中 ， 
这 些 方 法 要 么 什么 也 不 做 ， 要么 抛 出 一 个 异常。 
通过 会 话 公 开 的 最 重要 的 方法 ， 就 是 那些 提供 访问 工作 空间 树 条 目的 方法 。 
遍历 树 包 含 检索 根 (root) 节点 ,请 求 其 子 节点 ， 然 后 依次 遍历 其 子 节点 。 典 型 
方式 是 ， 用 户 通 常 开始 会 通过 调用 Session. getRootNode ( ) 方法 ， 返 回 工作 空间 
的 根 节点 ， 然 后 从 这 个 根 节点 开始 ， 用 户 可 以 遍历 工作 空间 树 。 方 法 说 明 如 下 : 

Node getRootNode () 

此 方法 返回 工作 空间 的 根 节 点 (A. )。 这 个 节点 是 工作 区 的 内 容 的 主要 接 入 
点 。 如 果 发 生 错 误 ， 则 抛 出 一 个 RepositoryException。 

直接 检索 一 个 节点 ， 也 可 以 使 用 Session. getNodeByUUID ( ) 或 Ses- 
sion. getliem () 方法 ， 直 接 访问 工作 空间 的 节点 。 例 如 ， 通 过 请 求 一 个 类 如 
“/customer/acme/ lrvine/address” 的 路 径 ， 或 请 求 一 个 可 引用 节点 的 UUID 来 完 
成 。 方 法 说 明 如 下 : 

Node getNodeByUUID (String uuid) 

此 方法 返回 由 给 定 的 UUID 指定 的 节点 。 只 适用 于 暴露 一 个 UUID 的 节点 ， 
换 句 话说 ， 就 是 那些 混和 人 节点 类 型 mix: referenceable。 

如 果 没 有 与 指定 的 UUID 相同 的 条 目 存在 ， 则 抛 出 一 个 HemNotFoundExcep- 
tion 异常 ;如 果 出 现 另 一 个 错误 ， 则 抛 出 一 个 RepositoryFxception 。 

Item getltem (String absPath ) 

此 方法 返回 在 工作 区 中 的 位 于 指定 的 绝对 路 径 的 条 目 。 如 果 在 指定 绝对 路 径 
上 没有 条 目 ， 则 抛 出 一 个 PathNotFoundException; 如 果 出 现 另 一 个 错误 ， 则 抛 出 
一 个 RepositoryException 。 

以 上 会 话 的 读 方法 ， 每 种 方法 都 有 其 优点 和 缺点 ， 所 以 “最 好 ”的 访问 方 
法 取决 于 内 容 的 结构 和 客户 所 需 的 操作 。 
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3.4.2.2 工作 空间 的 读 方法 

在 级 别 1 的 仓库 实现 中 ， 工 作 空间 对 象 只 封装 了 一 些 方法 ， 提 供 访问 关于 工 
作 空 间或 实现 类 的 信息 。 以 下 是 级 别 1 的 工作 空间 对 象 的 常见 方法 ， 工 作 空间 对 
象 也 有 其 他 的 方法 ， 在 级 别 2 中 涉及 ， 在 级 别 1 的 实现 中 ， 这 些 方法 要 么 什么 也 
不 做 ， 要 么 抛 出 一 个 异常 。 

1. Session getSession ( ) 

返回 请 求 此 工作 空间 对 象 的 Session 对 象 。 

2. String getName () 

返回 这 个 工作 空间 对 象 所 代表 的 实际 持续 工作 空间 的 名 称 。 这 也 是 在 Repos- 
itory. login 方法 中 使 用 的 名 称 。 

3. QueryManager getQueryManager () 

此 方法 返回 QueryManager， 搜 索 方法 通过 它 来 访问 ， 具体 见 3.4.6.5 节 
QueryManager， 如 果 出 现 一 个 错误 ， 则 抛 出 一 个 RepositoryException。 

4. NamespaceRegistry getNamespaceRegistry ( ) 

返回 NamespaceRegistry 对 象 ， 可 用 于 访问 前 缀 和 命名 空间 之 间 的 映射 。 
3.4.2.3 节点 读 方法 

以 下 是 在 级 别 1 中 定义 的 节点 方法 ， 它 们 被 用 来 获取 一 个 节点 的 子 节 点 和 
属性 。 

1. Node getNode (String relPath) 

返回 相对 于 这 个 节点 在 relPath 的 节点 。 如 果 relPath 包含 一 个 路 径 元 素 ， 它 
指向 具有 相同 名 称 的 同 级 节点 ， 没 有 明确 包括 一 个 使 用 阵列 式 符 号 的 索引 节点 
( [X]) ， 那 么 会 假定 为 索引 [1]。 

在 一 个 单一 Session 对 象 的 范围 内 ， 如 果 一 个 节点 已 通过 getNode 获得 ， 那 么 
任何 后 续 的 getNode 调用 所 重新 获得 相同 的 节点 ， 必 须 返 回 一 个 Node 对 象 ， 反 
映 了 作为 较 早 的 Node 对 象 的 相同 状态 。 此 对 象 或 者 是 实际 上 相同 的 节点 实例 ， 
或 者 只 是 简单 的 、 包 装 相同 的 状态 的 实现 。 

如 果 在 relPath 上 上， 没有 节点 存在 ,那么 抛 出 一 个 PathNotFoundException 
异常 。 

2. Nodelterator getNodes () 

此 方法 返回 当前 节点 的 所 有 子 节点 , 但 不 包括 该 节点 的 属性 ， 适 用 与 get- 
Node 相同 的 重 捕 语义 。 如 果 这 个 节点 没有 子 节 点 ， 那 么 返回 一 个 空 迭 代 器 。 

3. Property getProperty (String relPath) 

此 方法 取得 相对 于 这 个 节点 在 relPath 上 的 属性 ， 适 用 与 getNode 相同 的 重 捕 
语义 。 如 果 在 relPath 上 不 存在 属性 ， 那 么 抛 出 一 个 PathNotFoundException。 
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4. Item getPrimaryItem () 

这 个 节点 的 主要 节点 类 型 可 以 指定 一 个 该 节点 的 子 条 目 〈 子 节点 或 属性 ) 
作为 主要 的 子 项 ， 此 方法 返回 该 条 目 。 

如 果 此 节点 没有 主要 的 子 项 ， 或 者 是 因为 在 节点 类 型 中 没有 任何 声明 ， 或 者 
是 因为 一 个 声明 的 主要 子 项 不 存在 此 节点 的 实例 上 ， 那 么 这 个 方法 抛 出 一 个 
ItemNotFoundFException 异常 。 

$5. String getUUID () 

此 方法 返回 这 个 节点 的 UUID， 被 记录 在 节点 的 jcr: uuid 属性 中 ， 这 种 方法 
只 适用 于 混合 节点 类 型 mix: referenceable 的 节点 。 针 对 nonreferenceable 节点 ， 
此 方法 将 引发 一 个 UnsupportedRepositoryOperationException 异常 。 为 了 避免 抛 出 
一 个 异常 ， 通 过 调用 isNodeType ("mix :referenceable") 可 以 确定 节点 是 否 有 一 个 
UUID 。 
3.4.2.4 属性 读 方法 

内 容 仓库 中 的 所 有 内 容 最 终 是 通过 属性 来 访问 。JCR 中 不 区 分 “真正 的 ” 
数据 和 元 数据 ， 虽 然 它 允许 节点 类 型 指定 一 个 主要 子 项 ， 可 以 不 知道 它 的 名 称 间 
接地 检索 。 属 性 类 型 为 内 容 定义 期 竺 的 格式 ， 内 置 类 型 如 字符 串 、 二 进 制 、 日 
期 、 双 精度 、 单 精度 、 布 尔 、 名 称 、 路 径 和 引用 等 ; 后 两 种 提供 通过 内 容 仓库 路 
径 或 UUID 间接 的 访问 内 容 。 

以 下 是 级 别 1 定义 的 属性 的 方法 ， 它 们 被 用 来 读 取 一 个 属性 。 

1. Value getValue () 

作为 一 个 Value 对 象 ， 返 回 这 个 属性 的 值 。 如 果 这 个 属性 是 多 值 的 ， 此 方法 
将 引发 一 个 ValueFormatException 异常 ; 返回 的 对 象 是 一 个 存储 值 的 副本 ， 是 不 
可 改变 的 。 

2. String getString ( ) 

返回 这 个 属性 的 值 的 一 个 String 表示 ， 一 个 Property. getValue ( ). getString 
( ) 的 捷径 。 如 果 这 个 属性 是 多 值 的 ， 此 方法 将 引发 一 个 ValueFormatException 异 
党 ;如 果 这 个 属性 的 值 不 能 转换 为 一 个 Sking， 则 抛 出 一 个 ValueFormatException 
异常 。 

3. Item getNode () 

如 果 此 属性 是 REFERENCE 类 型 ， 此 方法 返回 这 个 属性 引用 的 节点 。 如 果 这 
属性 是 多 值 的 ， 此 方法 将 引发 一 个 ValueFormatException 异常 如果 这 个 属性 
不 能 被 转换 为 一 个 引用 ， 那 么 会 抛 出 一 个 ValueFormatException 异常 。 如 果 此 属 
性 是 一 个 REFERENCE 属性 ， 但 目前 的 版 本 存储 中 是 一 个 版 本 的 冻结 状态 的 一 部 
分 ， 此 方法 将 抛 出 一 个 ValueFormatException 异常 。 




















; 
洲 
四 








> 
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3.4.2.5 条 目 读 方法 

条 目 接口 还 包含 一 些 从 节点 和 属性 继承 过 来 的 其 他 方法 。 下 面 的 方法 提供 了 
访问 节点 和 属性 的 信息 。 条 目 还 具有 适用 于 级 别 2 的 其 他 方法 。 在 级 别 1 的 实现 
中 ， 它 们 将 什么 也 不 做 ,或 者 抛 出 一 个 异常 。 

1. String getPath () 

返回 到 这 个 条 目的 绝对 路 径 。 

如 果 路 径 中 包含 同名 兄弟 节点 或 者 多 值 属性 的 条 目 ， 那 么 在 路 径 上 的 元 素 将 
包括 适当 的 “ 方 括号 ”索引 表示 法 (例如 ,，/a/b [3]ve) 。 

如 果 发 生 错 误 ， 则 抛 出 一 个 RepositoryException 异常 。 

2. String getName () 

返回 这 个 条 目的 名 称 。 这 个 名 字 是 在 路 径 中 的 最 后 一 个 条 目 ， 减 去 任何 可 能 
存在 的 方 括号 索引 。 如 果 这 个 条 目 是 工作 空间 的 根 节 点 ( 即 ， 如 果 this. getDepth 
() == 0)， 将 返回 一 个 空 字符 串 。 

如 果 发 生 错 误 ， 则 抛 出 一 个 RepositoryException 异常 。 

3. Item getAncestor (int depth ) 

返回 低 于 根 的 指定 深度 的 祖先 。 一 个 深度 x 的 祖先 是 沿 着 从 根 节点 到 这 个 条 
目的 路 径 的 x 级 。 

1) 深度 =0， 返 回 根 节 点 。 

2) 深度 =1， 返 回 沿 着 根 节点 到 这 个 条 目的 路 径 ， 是 根 节点 的 孩子 。 

3) 深度 =2， 返 回 沿 着 根 节点 到 这 个 条 目的 路 径 ， 是 根 节点 的 孙子 。 

4) 深度 =n， 其 中 是 这 个 条 目的 深度 ， 它 返回 这 个 条 目的 本 身 。 如 果 深 
度 > 指定 的 n， 那 么 会 抛 出 一 个 TemNotFoundException 异常 。 

如 果 深 度 <0 或 深度 >n， 其 中 是 通过 getPath () 返回 的 路 径 的 深度 ， 那 
么 将 抛 出 一 个 IemNotFoundException 异常 。 

如 果 当 前 会 话 没 有 足够 的 访问 权限 检索 指定 的 节点 ， 那 么 会 抛 出 一 个 Ac- 
cessDeniedException 异常 。 

4. Node getParent ( ) 

返回 这 个 条 目的 父 节 点 。 如 果 没 有 父 节点 ， 则 抛 出 一 个 IemNotFoundExcep- 
tion 异常 。 这 只 会 发 生 在 这 个 条 目 是 一 个 工作 空间 的 根 节点 时 。 
3.4.2.6 例子 

以 下 部 分 提供 了 一 些 例子 ， 演 示 如 何 执行 节点 的 访问 和 读 取 属 性 。 为 了 给 例 
子 提供 一 些 上 下 文 ， 我 们 返回 到 前 面 的 仓库 结构 的 例子 ， 如 下 所 示 : 


Node 

















Property ="Some Value" 


[ root] 
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~ brodqucts 
— jcr :credted ="2001-01-O1T..." 
jcr:content 
—myapp:title ="Our Products..." 
—myapp:lead ="Geometrixx is proud..." 
—myapp:paragraph[1] 
| 一 myapp :text ="Geometrixx is..." 
[一 myapp:image = [binary data] 
—myapp:paragraph[ 2] 


一 Myapp:text ="We have..." 





— myapp:image =[ binary datoa | 





rhombus 
| 一 jcr :Created = "2002-06-01 TT" 
jor :ConNntent 
—myapp :title ="Rhombus:..." 
—myapp :price = "7123.00" 
—myapp :lead ="Here at..." 
-一 myapp :paragraph[1] 


| 一 myapp:text ="The rhombus...'" 
让 二 = 


myapp:image =| binary data | 





—myapp :paragraph| 2| 
| 一 myapp:text 三 "Some say..." 
[一 myapp:image = [binary data] 
假设 程序 员 已 经 调用 : 
Session session =... 
Node root = session. getRootNode( ) ; 


从 根 节点 ， 可 以 访问 工作 空间 中 的 任何 节点 或 属性 。 例 如 : 


Node nl =root. getNode( "products"); 





Node n2=n1. getNode( rhombus'"); 

Node n3 =n2. getNode( "jcr:content") ; 

Node n4 =n3. getNode( "myapp :paragraph[ 2]"); 
Property p =n4. getProperty( "myapp :text") ; 
Value v =p. getValue( ) ; 

String s =v. getString( ) ; 


System. out. printin(s) ; 
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程序 运行 后 ， 将 打印 “Some say. . . ”到 标准 输出 。 另 外 ， 更 方便 的 直接 访 
问 也 是 可 能 的 : 
Property p =root. getProperty ("products/rhombus/ 
jcr:content/myapp:paragraph[ 2|] /myapp: text") ; 
System. out. printin( p. getString( ) ) ; 
在 这 里 ,我 们 使 用 相对 路 径 ， 从 根 到 深层 次 结构 中 的 访问 属性 。 同 时 ， 遍历 
层次 结构 是 很 容易 做 到 。 例 如 ， 考 虑 下 面 的 方法 : 


public void traverse( Node n，int level) throws RepositoryException | 





String name =(n. getDepth( ) = =0) ? "/" . n.getName( ) ; 
System. out. printin( makeIndent( level) +name ) ; 
for (Propertylterator i=n. getProperties( ) ; i.hasNext( );) | 
Property p =i. nextProperty( ) ; 
System. out. printin( makeIndent (level +1) +p. getName( ) +"= \" 
+ pb. getstring( ) +"\"); 
| 
for (Nodelterator i=n. getNodes( ) ; i. hasNext( ) ; ) | 
Node nn =i. nextNode( ) ; 


traverse( nn ，level +1 ) ; 


| 
调用 
traverse( root, 0); 
将 打印 如 下 : 
/ 
products 
jcr :created ="2001-01-O1T..." 
Jjcr :content 
myapp :title ="Our Products..." 
myapp :lead ="Geometrixx is proud..." 
myapp :paragraph[1|] 
myapp :text ="Geometrixx is..." 
myapp:image =" 
myapp :paragraph|[ 2| 
myapp :text ="We have..." 


myapp :image 
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rhombus 

Jjcr :created ="2002-06-O1 TT..." 
jcr:content 

myapp :title ="Rhombus:..." 
myapp : price = "123. 00" 

myapp :lead = "Here at..." 
myapp :paragraph[1|] 
myapp:text ="The rhombus..." 
myapp :image =" 

myapp :paragraph[ 2] 
myapp :text ="Some say..." 


myapp:image 三 
3.4.3 命名 空间 


一 个 标准 的 内 容 仓 库 提供 支持 条 目 和 节点 类 型 名 称 的 命名 空间 。 命 名 空间 为 
来 自 不 同 来 源 和 应 用 域 的 条 目 和 节点 类 型 服务 ， 防 止 命名 冲突 ， 命 名 空间 系统 是 
参考 仿照 了 XML 的 命名 空间 。 

每 个 仓库 有 一 个 单一 的 、 持 久 的 命名 空间 注册 ， 由 NamespaceRegistry 对 象 
表示 ， 通 过 Workspace. getNamespaceRegistry ( ) 方法 访问 。 以 下 介绍 在 级 别 1 里 
面 NamespaceRegistry 支持 的 方法 . 

1. String [ ] getPrefixes () 

返回 一 个 数组 ,保存 有 所 有 目前 注册 的 前 级 。 如 果 发 生 错 误 ， 则 抛 出 一 个 
RepositoryException 。 

2. String [ ] getURIs () 

返回 一 个 数组 ,保存 着 所 有 目前 注册 的 URI。 如 果 发 生 错 误 ， 则 抛 出 一 个 
RepositoryException 。 

命名 空间 注册 表 总 是 包含 至 少 以 下 内 置 的 映射 ; 

jcr - > http://www. jcp. org/jcr/1.0 

为 在 内 置 的 节点 类 型 中 定义 的 条 目 保 留 ， 例如 ， jcr: content。 

nt - > http://www. jcp. org/jcr/nt/1.0 

为 内 置 的 主 节 点 类 型 的 名 称 保留 。 

mix - > http://www. jcp. org/jcr/mix/1.0 

xml - > http://www. w3. org/XML/1998/namespace 

为 与 XML 兼容 的 原因 保留 。 这 个 前 缀 不 应 该 被 客户 端的 API 使 用 ， 在 正常 
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节点 或 属性 的 名 称 中 ， 这 样 做 将 导致 导出 到 XML 出 现 问 题 。 
3.4.4 XML 映射 


级 别 1 支持 两 种 内 容 仓库 的 数据 模型 到 XML 的 映射 。 映 射 被 称 为 系统 视图 
和 文档 视图 。 
3.4.4.1 系统 视图 XML 映射 

系统 视图 映射 提供 了 一 个 完整 的 工作 空间 的 内 容 序列 化 到 XML， 而 不 丢失 
言 息 。 在 级 别 1， 这 使 得 可 以 导出 工作 空间 的 完整 内 容 。 在 级 别 2， 通 过 导出 和 
导入 ， 这 也 使 得 可 以 往返 内 容 到 XML。 

针对 工作 空间 中 的 一 个 子 树 ， 生 成 的 系统 视图 需要 遵循 一 些 映射 的 规则 。 

例如 ， 具 有 以 下 结构 的 子 树 : 


和 Node 








Property = "value" 
myapp:document 
| 一 jcr :primaryType ="mynt:document" 
| 一 myapp:title ="JSR 170" 
| 一 mya pp:lead ="Content Repository" 
-一 myapp:body 
| 一 jcr:primaryType ="mynt: body" 
[一 myapp :paragraph 
| 一 jcr: primaryType ="mynt:paragraph" 
| 一 myapp :title ="Node Types" 
[一 myapp :text ="AnN important feature..." 
此 例子 中 ， 除 了 内 置 的 以 外 ， 源 仓库 的 命名 空间 注册 表 还 保持 了 下 面 的 
映射 ; 
myapp - > http://mycorp. com/myapp 
和 
mynt - > nttp://mycorp. com/mynt 
映射 后 的 系统 视图 ,显示 为 


<? xml version =".0" encoding ="UTF-8"? > 














<sv:node xmlns:jcr ="http://www. jcp. org/jcr/1.0" 
xmins:nt ="http://www. jcp. org/ jcr/nt/1.0" 
xmins :mix ="http://www. jcp. org/jcr/mix/1.0" 
xmlns:sv ="http://www. jcp. org/jcr/sv/1.0" 
xmlns:myapp ="http://mycorp. com/myapp" 
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xmlns:mynrnt ="http://mycorp. com/mynt" 


sv:name ="myapp :document'" > 
<sv:property sv:name ="jcr:primaryType" sv:type ="Name'"> 
<sv:value >mynt:document </sv:value > 
</sv:property > 
<sv:property sv:name ="myapp :title" sv:type ="String' > 
<sv:value >JSR 170 </sv:value > 
</sv:property > 
<sv:property sv:name ="myapp :lead" sv:type ="String' > 
<sv:value >Content Repository </sv:value > 
</sv:property > 
<sv:node sv:name ="myapp:body'> 
<sv:property sv:name ="jcr:primaryType" sv:type ="Name' > 
<sv:value >mynt:body </sv:value > 
</sv:property > 
<sv:node sv:name ="myapp:paragraph'" 之 
<sSv:property sviname ="jcr:primaryType" sv:type = Name' > 
<sv:value >mynt:paragraph </sv:value > 
</sv:property > 
<sv:property sv:name ="myapp :title' sv:type ="String' 之 
<sv:value >Node Types </sv:value > 
</sv:property > 
<sv:property sv:name ="myapp:text" sv:type ="String'" > 
<sv .value >An important feature... <sv:value > 
</sv:property > 
</sv:node > 
</sv:node > 
</sv:node > 
注意 ， 上 面 的 XML 已 被 格式 化 以 提高 可 读 性 ， 实 际 的 XML 流 中 ， 在 元 素 或 
属性 之 间 ， 可 能 没有 任何 多 余 的 空白 。 
3.4.4.2 文档 视图 XML 映射 
文档 视图 的 设计 目的 是 为 了 比 系统 视图 更 加 友好 可 读 ， 它 的 实现 以 牺牲 完整 
性 为 代价 。 在 级 别 1 中 ,文档 视图 被 用 作对 XPath 查询 运行 的 虚拟 XML 流 的 格 
式 。 同 时 ， 在 级 别 1 中 ,支持 导出 到 文档 视图 的 格式 ， 这 也 是 导出 仓库 内 容 的 
基础 。 
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实际 上 ， 文档 视 图 映射 包含 了 一 套 相 关 的 映射 ， 它 可 以 根据 使 用 它 的 上 下 
文 ， 导出、 导入 或 XPath 查询 进行 变化 。 规 范 中 详细 讨论 了 文档 视图 映射 的 一 般 
结构 ， 以 及 解释 了 在 特殊 情况 下 ， 上 下 文 相 关 的 差异 和 可 选 功能 。 

下 面 给 出 一 个 与 系统 视图 例子 相同 设置 的 子 树 和 命名 空间 的 例子 。 文 档 视 图 
将 看 起 来 如 下 所 示 ， 注 意 ， 下 面 的 示例 假定 多 值 属性 不 支持 序列 化 : 


<? xml version =".0" encoding ="UTF-8"? > 





<myapp:document xmlns: jcr ="http://www. jcp. org/jcr/1.0" 
xmins:nt ="http://www. jcp. org/ jcr/nt/1.0" 
xmins :mix ="http://www. jcp. org/ jcr/mix/1.0" 
xmlns:myapp ="http://mycorp. com/myapp" 
xmins:mynt ="http://mycorp. com/mynt" 
jcr:primaryType ="mynt:document'" > 
myapp :title ="JSR 170" 
myapp :lead ="Content Repository" > 
<myapp:body jcr:primaryType ="mynt:body'"> 
<myapp:paragraph jcr:primaryType ="mynt:paragraph" 
myapp:title ="Node Types" 
myapp: text ="An important feature..."/ > 
</myapp:body > 
</myapp:document > 
注意 ， 上 面 的 XML 已 被 格式 化 以 提高 可 读 性 ， 实 际 的 XML 流 中 ， 在 元 素 或 
属性 之 间 ， 可 能 没有 任何 多 余 的 空白 。 


3.4.5 导出 仓库 内 容 


JCR 的 级 别 1 支持 两 种 数据 模型 到 XML 的 映射 系统 视图 和 文档 视图 。 系 
统 视 图 映射 提供 完整 工作 空间 的 内 容 序 列 化 到 XML， 而 不 会 丢失 信息 ， 这 意味 
着 完整 的 工作 空间 的 内 容 可 以 导出 。 系 统 视图 的 优点 是 任何 有 效 的 内 容 仓 库 的 内 
容 可 以 用 XML 表示 ， 其 缺点 是 产生 的 格式 有 一 定 的 阅读 困难 。 相 反 ， 文 档 视图 
的 设计 是 为 了 便于 人 们 可 读 ， 尽 管 它 的 实现 以 牺牲 完 整 性 为 代价 。 文 档 视 图 的 价 
值 主要 在 于 XPath 查询 更 容易 编写 和 理解 。 

级 别 1 支持 仓库 内 容 导 出 为 系统 视图 XML 和 文档 视图 XML。XML 可 以 作为 
一 个 流 或 SAX 事件 输出 ， 在 会 话 对 象 中 支持 相应 的 导出 方法 。 
3.4.5.1 导出 为 系统 视图 的 方法 

导出 为 系统 视图 的 方法 如 下 所 示 : 


Void exportSystemView (String absPath, ContentHandler contentHandler, boolean 
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skipBinary ，boolean noRecurse ) 
通过 调用 org. xml. sax. ContentHandler 提供 的 方法 ， 把 absPath 路 径 上 的 节点 
序列 化 为 一 系列 的 SAX 事件 ， 如 果 noRecurse 是 false， 就 序列 化 整个 子 树 。 生 成 
的 XML 是 系统 视图 形式 。 注 意 ，absPath 必须 是 一 个 节点 的 路 径 ， 而 不 是 一 个 
属性 。 

如 果 skipBinary 为 tue， 那 么 PropertyType. BINARY 的 任何 属性 将 被 序列 化 ， 
就 当 它们 是 空 的 。 也 就 是 说 ， 存 在 的 属性 将 被 序列 化 ， 但 其 内 容 不 会 出 现在 序列 
化 输出 ， < sv: value > 元素 将 没有 内 容 。 

如 果 noRecurse 为 true， 那么 只 有 在 absPath 上 的 节点 及 其 属性 不 是 它 的 子 节 
点 ， 会 被 序列 化 。 如 果 noRecurse 为 false， 那 么 植 根 于 absPath 上 的 整个 子 树 都 
会 被 序列 化 。 

如 果 在 absPath 上 没有 节点 存在 ， 则 抛 出 一 个 PathNotFoundException 。 
3.4.5.2 导出 为 文档 视图 的 方法 

导出 为 文档 视图 的 方法 如 下 所 示 : 


exportDocumentView (String absPath, ContentHandler contentHandler, boolean 

















skipBinary, boolean noRecurse) 

通过 调用 org. xml. sax. ContentHandler 提供 的 方法 ， 把 absPath 路 径 上 节点 
序列 化 为 一 系列 的 SAX 事件 ， 如 果 noRecurse 是 false ， 就 序列 化 整个 子 树 。 产 
生 的 XML 是 文档 视图 形式 。 注 意 ，absPath 必须 是 一 个 节点 的 路 径 ， 而 不 是 一 
个 属性 。 

如 果 skipBinary 为 tue， 那 么 PropertyType. BINARY 的 任何 属性 将 被 序列 化 ， 
就 当 它 们 是 空 的 。 也 就 是 说 ， 存 在 的 属性 将 被 序列 化 ,但 其 内 容 不 会 出 现在 序列 
化 输出 ， 属 性 值 将 是 空 的 ; 如 果 skipBinary 为 false， 那 么 每 一 个 BINARY 属性 的 
实际 值 会 使 用 Base64 编码 记录 。 

如 果 noRecurse 为 true， 那 么 只 有 在 absPath 上 的 节点 及 其 属性 不 是 它 的 子 节 
点 ， 会 被 序列 化 。 如 果 noRecurse 为 false， 那 么 植 根 于 absPath 上 的 整个 子 树 都 
会 被 序列 化 。 

如 果 用 户 缺 少 一 些 指定 的 树 分 支 上 的 读 访 问 权 限 ， 那 么 树 分 支 不 会 得 到 序列 
化 ， 因 为 从 用 户 的 角度 来 看 ， 它 不 存在 。 

如 果 在 absPath 上 没有 节点 存在 ， 则 抛 出 一 个 PathNotFoundException。 

注意 ， 导 出 产生 的 XML 流 必 须 以 UTF-8 编码 。 


3.4.6 搜索 仓库 内 容 


在 级 别 1 中 ， 支持 XPath 语法 是 必需 的 。 另外 ， 一 个 仓库 可 以 支持 SQL 语 
法 ， 具 体 实现 可 能 还 支持 其 他 语言 。 
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XPath 是 一 种 检索 语言 ， 最 初 设计 用 于 从 XML 文档 中 选择 元 素 。 由 于 工作 
空间 像 一 个 XML 文档 ,仓库 模型 的 节点 和 属性 树 类 似 于 XML 文档 的 元 素 、 元 素 
属性 和 元 素 内 容 的 树 结构 ， 可 以 作为 一 个 树 结 构 来 看 ，XPath 提供 了 一 种 方便 的 
语法 搜索 工作 空间 的 内 容 。 提 供 的 XPath 查询 的 主要 先决 条 件 是 建立 一 个 工作 空 
间 树 的 XML 映射 。 为 了 序列 化 和 反 序 列 化 的 目的 , 已 经 建立 这 种 映射 (系统 和 
文档 视图 ) ， 我 们 只 需 重新 使 用 其 中 之 一 ， 文 档 视图 ， 作 为 对 XPath 查询 运行 的 
基础 。 
3.4.6.1 文档 视图 上 的 XPath 

XPath 提供 一 个 方便 的 语法 来 搜索 JCR 的 内 容 ，XPath 查询 表达 式 可 以 被 定 
义 和 执 行 ， 就 好 像 它 们 被 应 用 到 当前 工作 空间 的 XML 文档 视图 ， 返 回 一 个 匹配 
查询 的 属性 名 称 和 内 容 的 表 。 

当 执行 一 个 XPath 查询 时 ， 指 定 的 XPath 表达 式 被 应 用 到 搜索 的 工作 空间 的 
文档 视图 。 例 如 ， 考 虑 包含 下 面 结构 的 工作 空间 : 


<? xml version =".0" encoding ="UTF-8"? > 












































<jcr:root xmlns:jcr ="http ://www. jcp. org/ jcr/1.0" 


xmins:nt ="http://www. jcp. org/jcr/nt/1.0" 


xmlns:mix ="http://www. jcp. org/jcr/mix/1.0" 
xmlns:myapp ="http://mycorp. com/myapp" 
xmlns:mynt ="http://mycorp. com/mynt'" 
jcr:primaryType = "nt:unstructured'> 


<myapp:document jcr:primaryType ="mynt:document'" 之 
myapp :title ="JSR 170" 
myapp:lead ="Content Repository' > 
<myapp:body jcr:primaryType ="mynt:body'> 
<myapp:paragraph jcr:primaryType ="mynt:paragraph" 
myapp :title ="Node Types" 
myapp: text ="An important feature..."/ > 
</myapp:body > 
</myapp:document > 
</jcr:root > 
在 这 个 例子 中 ， 为 了 找到 名 为 myapp: paragraph 的 节点 ， 使 用 下 面 的 XPath 
表达 式 : 
//element( * , mynt:paragraph)[@myapp:title ="Node Types"] 
针对 这 个 XPath， 查 询 将 返回 位 于 仓库 工作 空间 路 径 上 的 节点 : 
/myapp:document/myapp:body/myapp:paragraph 
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3. 4. 6.2 ”XPath 和 SQL 

在 级 别 1 中 ，XPath 2.0 构成 查询 语法 的 基础 。 所 有 标准 内 容 库 的 实现 必须 
文 持 这 个 搜索 语法 。 然 而 ， 使 用 关系 数据 库 作 为 底层 数据 存储 的 实现 ， 通 常会 被 
限制 在 它们 可 以 有 效 地 支持 XPath 查询 的 范围 内 。 这 样 的 实现 会 发 现 文 持 可 选 的 
SQL 语法 更 自然 契合 。 

因此 ， 为 了 确保 后 端 是 数据 库 支持 的 实现 ， 迎 合 没 有 必要 的 合 规 性 要 求 的 负 
担 ， 只 需要 一 个 XPath 的 子 集 。 该 子 集 被 定义 为 XPath 语句 的 集合 ， 在 解析 查询 
时 ， 可 以 在 XPath 和 SQL 之 间 被 翻译 。 

这 种 安排 允许 后 端 是 数据 库 支 持 的 仓库 实现 与 SQL 的 本 地 搜索 ， 但 通过 把 
XPath 查询 转换 为 SQL， 仍 符合 最 小 的 XPath 要 求 。 

另 一 方面 ， 通 过 本 地 层次 的 实现 ， 还 能 够 支持 超出 最 低 要 求 的 XPath 功能 。 

如 前 所 述 ， 对 SQL 的 文 持 是 可 选 的 。 但 由 于 XPath 特性 的 最 小 集合 是 由 SQL 
语义 范围 驱动 ， 在 两 个 目标 之 间 的 映射 知识 ， 很 大 程度 基于 对 XPath 的 最 小 功能 
集 的 理解 。 
3.4.6.3 一 个 查询 的 结构 

一 个 查询 ， 或 是 XPath 或 是 SQL， 指 定 在 工作 空间 内 节点 的 一 个 子 集 ， 称 为 
结果 集 。 结 果 集 构成 在 工作 空间 中 的 所 有 节点 ， 它 们 满足 查询 中 所 规定 的 限制 。 
约束 分 为 以 下 三 类 ; 

1) 类 型 约束 : 这 限制 了 返回 的 节点 要 满足 一 个 特定 的 主 节点 类 型 ， 同 时 可 
能 男 外 限制 这 些 节 点 要 满足 特定 的 混合 节点 类 型 。 

2) 属性 约束 : 这 限制 返回 节点 要 满足 那些 特定 属性 具有 特定 值 。 

3) 路 径 约 束 : 这 限制 返回 节点 必须 在 工作 空间 中 的 某 些 子 树 下 。 

一 个 查询 结果 ， 以 两 个 平行 的 形式 被 返回 : 一 个 在 节点 结果 集 上 的 近 代 器 和 
一 个 表 ， 表 中 的 每 一 行 对 应 结果 集中 的 一 个 节点 。 查 询 语句 还 定义 了 这 两 个 返回 
的 对 象 是 如 何 通 过 两 个 表达 规范 来 被 结构 化 的 方面 : 

1) 字段 规范 : 这 指定 了 属性 集 ， 它 将 构成 返回 表 的 字段 。 

2) 排序 规范 : 这 指定 了 在 迭代 器 中 节点 的 顺序 ， 以 及 在 表 中 行 的 顺序 。 
3.4.6.4 搜索 范围 和 查询 API 

一 个 查询 搜索 与 当前 会 话 相 关联 的 持久 性 的 工作 空间 。 它 不 搜索 任何 未 决 
的 ， 比 如 在 会 话 中 记录 的 变化 ， 但 还 没有 被 保存 。 

一 个 内 容 仓库 中 的 查询 机 制 ， 是 通过 QueryManager 对 象 来 实现 访问 的 ， 工 
作 空 间接 口 提 供 对 QueryManager 对 象 的 访问 ; 

QueryManager getQueryManager( ) 

返回 QueryManager， 通 过 这 个 对 象 ， 可 以 访问 搜索 方法 ， 如 果 有 错误 发 生 ， 
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则 抛 出 一 个 RepositoryException 异常 。 
3.4.6.5 QueryManager 
QueryManager 对 象 提供 方法 ， 来 创建 查询 、 检 索 保存 的 查询 ， 以 及 发 现 支持 
查询 语言 ， 方 法 说 明 如 下 : 
1. Query createQuery (String statement, String language) 
通过 指定 查询 语句 本 身 ， 以 及 指定 查询 时 表示 的 语言 ， 来 创建 一 个 新 的 查 
询 。 基 于 指定 的 语言 ， 如 果 查 询 语 名 在 语法 上 是 无 效 的 ,会 抛 出 一 个 In- 
validQueryException 异常 。 语 言 参数 必须 是 一 个 从 QueryManager. getSupportedQuery- 
Languages () 返回 的 字符 串 ; 如 果 不 是 ,那么 会 抛 出 一 个 InvalidQueryException 
异常 。 
2. Query getQuery ( Node node ) 
检索 现 有 的 持久 性 查询 。 如 果 节 点 不 是 一 个 有 效 的 持久 性 查询 ， 即 不 是 类 型 
nt: query 的 节点 ， 那 么 会 搜 出 一 个 InvalidQueryException 异常 。 
首次 使 用 QueryManager. createQuery 创建 一 个 查询 对 象 ， 会 创建 持久 性 查询 ， 
然后 调用 Query. save 把 查询 持久 化 到 工作 空间 中 的 一 个 位 置 。 
3. String [ ] getSupportedQueryLanguages () 
此 方法 返回 一 个 字符 串 数 组 ， 明 确 支 持 的 查询 语言 。 在 级 别 1， 这 个 集合 必 
须 包 含 由 常量 Query. XPATH 代表 的 字符 串 。 如 果 支 持 SQL 查询 ， 它 还 必须 包括 
附加 的 Query. SQL， 任 何 级 别 的 实现 也 可 以 支持 其 他 语言 。 
3.4. 6.6 ”查询 对 象 
通过 调用 QueryManager. createQuery， 创 建 一 个 新 的 查询 。 返 回 的 查询 对 象 
有 以 下 几 种 方法 : 
1. QueryResult execute () 
执行 此 查询 ， 并 返回 一 个 QueryResult 对 象 。 
2. String getStatement ( ) 
返回 为 此 查询 定义 的 语句 。 
3. String getStoredQueryPath () 
如 果 这 是 一 个 已 使 用 Query. storeAsNode 方法 存储 的 查询 (不 论 是 否 已 被 保 
存 ) ， 或 使 用 QueryManager getQuery 方法 执行 的 检索 ， 那 么 此 方法 返回 存储 查询 
的 nt: query 节点 的 路 径 。 
如 果 这 是 一 个 短暂 的 查询 ， 也 就 是 使 用 QueryManager. createQuery 创建 的 查 
询 对 象 ， 但 尚未 存储 ， 那 么 此 方法 抛 出 一 个 TemNotFoundException 异常 。 


3.4.7 节点 类 型 


许多 内 容 仓库 的 一 个 重要 特点 就 是 能 够 通过 类 型 来 区 分 存储 在 库 中 的 实体 。 
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在 一 个 内 容 仓库 中 ， 这 是 通过 给 节点 分 配 节点 类 型 来 实现 的 。 

在 JCR 仓库 中 的 每 一 个 节点 ， 都 必须 有 且 只 有 一 个 主 节 点 类 型 。 主 节点 类 
型 定义 名 称 、 类 型 和 其 他 属性 及 子 节点 的 特征 。 一 个 节点 也 可 以 有 一 个 或 多 个 混 
合 (mixin) 类 型 ， 它 们 为 主 节点 定义 的 特征 〈 例 如 ， 更 多 子 节 点 的 属性 和 它们 
各 自 的 名 称 和 类 型 ) 提供 附加 的 特性 。 

JCR 的 级 别 1 提供 发 现 现 有 节点 类 型 的 方法 ， 以 及 读 取 在 仓库 中 可 用 的 节点 
类 型 的 定义 的 方法 。 级 别 1 为 以 下 节点 类 型 相关 的 功能 指定 了 方法 : 

1) 发 现 一 个 现 有 节点 的 主要 和 混合 节点 类 型 。 

2) 发 现在 一 个 特定 的 仓库 中 ， 支 持 哪 种 节点 类 型 。 

3) 发 现 一 个 支持 的 节点 类 型 的 定义 。 

4) 发 现 由 于 它 的 父 节点 类 型 ， 导 致 在 现 有 的 节点 或 属性 上 的 限制 。 

在 级 别 2， 指 定 了 额外 的 方法 : 

1) 在 节点 创建 时 ， 为 一 个 节点 分 配 一 个 主 节点 类 型 。 

2) 分 配额 外 的 、 可 选 的 混合 节点 类 型 。 














3.4.8 系统 节点 


保留 位 置 /jcr， system， 作 为 一 个 系统 文件 夹 使 用 。 一 些 实现 可 能 会 使 用 
这 个 位 置 存储 或 公开 在 内 容 中 的 仓库 内 部 数据 。 例 如 ， 如 果 一 个 仓库 公开 内 
容 的 节点 类 型 定义 ， 那么 这 些 节点 类 型 定义 应 该 位 于 /jcr: system/jcr: node- 


Types。 
如 果 一 个 仓库 支持 版 本 化 ， 那 么 它 必须 公开 版 本 存储 ， 在 /jcr: system/jer: 
versionStorage。 


如 果 要 支持 /jcr， system， 那 么 其 节点 类 型 留 给 了 实现 。 
3.4.9 访问 控制 


一 个 兼容 级 别 1 的 实现 必须 支持 访问 控制 发 现 方 法 Session. checkPermission。 
在 最 简单 的 情况 下 ， 一 个 实现 可 能 实际 上 并 不 支持 访问 控制 ， 此 方法 的 行为 可 以 
进行 硬 编码 。 

在 一 个 支持 访问 控制 的 库 中 ， 根 据 有 关 访 问 控制 策略 ， 这 个 方法 会 报告 一 个 
特定 会 话 是 否 有 权 来 执行 特定 的 动作 。 然 而 ， 在 规范 中 并 没有 试图 定义 访问 控制 
策略 设置 的 机 制 。 

如 前 所 述 ， 访 问 仓库 时 ， 由 Repository. login 返回 Session 对 象 ， 有 反映 了 一 个 
寺 别 的 访问 权限 集 。 这 些 权限 的 判断 可 以 通过 登录 ,或 由 一 些 外 部 认证 和 授权 机 
制 内 区 入 该 库 实现 。 
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3.5 级 别 2 仓库 功能 





JCR 的 级 别 2 定义 了 一 个 读 / 写 的 内 容 仓库 ， 不 仅 包 括 所 有 级 别 1 的 功能 
还 包括 下 列 功能 

1) 添加 和 删除 节点 及 属性 。 

2) 写 属性 的 值 。 

3) 持久 化 命名 空间 的 变化 。 

4) 从 XML/SAX 源 导入 内 容 。 

5) 给 节点 分 配 节 点 类 型 。 

以 下 部 分 介绍 级 别 2 功能 基础 上 的 内 容 仓 库 API。 


3.5.1 写 仓库 内 容 


写 内 容 到 仓库 的 方法 分 为 两 种 : 第 一 种 是 直接 写 人 到 工作 空间 ， 第 二 
入 到 与 会 话 相关 联 的 临时 存储 。 后 者 要 求 保 存 它们 被 写 入 到 工作 空间 的 变化 ， 
者 没有 要 求 。 
3.5.1.1 写 入 到 临时 存储 

会 话 的 临时 存储 的 目的 是 提供 一 个 空间 ， 这 样 ， 复杂 的 变化 可 以 写 入 内 容 ， 
而 不 必 在 每 一 步 验 证 这 些 变 化 。 当 一 个 节点 /属性 结构 组 装 完 毕 时 ， 对 节点 类 型 
和 其 他 方面 的 限制 可 以 被 保存 和 被 验证 。 这 使 得 当 它 们 正 被 创建 时 ， 节 点 和 属性 
的 结构 是 暂时 无 效 的 。 

写 和 人 到 临时 层 的 方法 如 下 : 

1) Node. addNode, setProperty, orderBefore, addMixin 和 removeMixin 。 





2) Property. setValue。 

3) Item. remove。 

4) Session. move 和 importXML。 

5) Query. storeAsNode。 

通过 这 些 方法 的 改变 ， 添 加 和 移 除 节点 和 属性 。 级 别 2 包括 添加 、 移 动 、 复 
制 和 删除 会 话 的 工作 空间 范围 内 的 条 目 ， 当 客 户 端 请 求 一 个 保存 时 的 持久 化 ， 以 
及 在 工作 空间 之 间 移 动 、 复 制 和 克隆 条 目的 方法 。 当 调用 一 个 保存 方法 的 时 候 ， 
其 中 包括 在 其 范围 内 的 变化 ， 客 户 庄 还 可 以 比较 当前 工作 空间 的 状态 (例如 ， 
发 现 可 能 已 经 被 其 他 一 些 客户 端 保存 的 更 改 ) ， 或 者 合并 到 自身 的 变化 ， 目 前 的 
状态 或 完全 放弃 更 改 其 未 保存 的 更 改 。 

Session. save 持久 化 当前 存储 在 Session 对 象 中 的 所 有 甚而 未 决 的 变化 。 相 
反 ，Session. refresh 丢弃 目前 存储 在 会 话 中 的 所 有 巧 而 未 决 的 变化 。 
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在 级 别 2， 通 过 节点 和 属性 对 象 上 的 方法 ， 可 以 设置 属性 值 ， 其 中 大 部 分 的 
内 容 (除了 结构 化 信息 ) 实际 上 是 存储 的 。 检 查 属性 类 型 ， 如 果 该 值 与 预期 的 
格式 不 兼容 时 ， 属 性 值 或 者 被 转换 为 该 属性 的 定义 格式 ， 或 者 将 引发 异常 。 

针对 更 改 保存 或 丢弃 ， 要 处 理 更 细 粒 度 的 控制 权 ， 也 提供 了 Item. save 和 
Item. refresh。Item. save 保存 所 有 悬而未决 的 变化 ， 适 用 于 特定 条 目 及 其 子 树 。 
类 似 地 ，Item. refresh 丢弃 所 悬 而 未 决 的 变化 ， 适 用 于 该 条 目 及 其 子 树 。 

3. 5.1.2 直接 写 入 工作 空间 
直接 写 变 化 到 工作 空间 的 方法 是 : 


1) Node. checkin ， checkout, restore, restoreByLabel, merge, cancelMerge, 














doneMerge, update, lock 和 unlock。 

2) Workspace. move, copy, clone, restore 和 importXML。 

3) VersionHistory. addVersionLabel, removeVersionLabel, removeVersion。 

只 有 在 支持 相关 的 功能 的 库 中 ， 有 些 是 相关 的 ， 比 如 ， 锁 定 或 版 本 。 
3.5.1.3 ”通过 UUID 和 路 径 保存 

当 保 存 一 个 条 目 时 ， 无 论 是 通过 Item. save 或 执行 Session. save ， 挂 起 的 更 改 
写 人 持久 性 存储 的 条 目 ， 使 用 相同 的 原则 。 在 这 种 情况 下 ， 不 同 的 是 ， 对 应 关系 
不 是 在 两 个 工作 空间 之 间 ， 而 是 在 会 话 的 临时 存储 及 其 相关 的 工作 空间 的 持久 存 
储 之 间 。 在 保存 一 个 节点 的 背景 下 ， 这 些 原则 如 下 : 

1) 如 果 临 时 条 目 都 有 一 个 UUID ,那么 改变 会 写 人 到 有 相同 的 UUID 的 持久 
条 目 。 

2) 如 果 临 时 条 目 没有 一 个 UUID， 那么 其 最 近 的 祖先 , 或 祖先 的 祖先 的 
UUID 与 它 的 相对 路 径 结 合 ， 被 用 来 确定 条 目的 变化 将 被 写 和 持久。 例如 ， 如 果 

QD 节点 /a/b/e 和 节点 /aAb， 没 有 UUID。 

@ 节点 /a 有 UUID, 为 u。 

@@) 那么 ， 瞬 态 节 点 /a/b/ce 挂 起 的 更 改 ， 被 写 人 位 于 路 径 bye 的 持久 节点 ， 
相对 于 有 UUID 的 持久 节点 。 
3.5.1.4 添加 节点 

添加 节点 的 方法 如 下 : 

Node addNode (String relPath ) 

在 relPath 上 创建 一 个 新 的 节点 ， 在 符合 父 节点 的 节点 类 型 的 约束 条 件 下 ， 
新 的 节点 将 被 保存 。 

为 了 保存 一 个 新 加 入 的 节点 ， 必 须 在 会 话 对 象 上 ,或 新 节点 的 父 或 高 阶 的 祖 
先 (祖父 等 ) 上 调用 保存 方法 。 只 对 新 增 的 节点 尝试 调用 保存 ， 会 抛 出 一 个 
RepositoryException 异 常 。 


在 relPath 提供 的 这 种 方法 的 上 下 文中 ,不 能 有 一 个 在 其 最 后 一 个 元 素 的 索 
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引 。 如 果 这 样 的 话 ， 那 么 会 抛 出 RepositoryException 异常 。 

例如 ， 如 果 我 们 想 添加 一 个 新 的 “三 角形 ”到 我 们 的 产品 信息 ， 我 们 可 以 
这 样 做 : 

Node productsNode = root. getNode("products") ; 

Node triangleNode =productsNode. addNode(' 三 角形 "); 

Node contentNode =triangleNode. addNode( "jcr:content") ; 


contentNode. setProperty( "myapp:title", "三 角形 . 一 个 经 济 的 选择 ") ; 





contentNode. setProperty( "myapp :price"，50 ) ; 

contentNode. setProperty("myapp:lead", "三 角形 有 三 条 边 , 但 不 总 是 相等 
的 ! "); 

productsNode. save( ) ; 

这 将 在 产品 节点 下 增加 新 节点 三 角形 ， 并 给 三 角形 的 jecr: content 节点 添加 
属性 myapp: title、myapp: price 和 myapp: lead， 并 指定 相应 属性 值 。 

作为 男 一 个 例子 ,假设 我 们 要 遍历 一 个 字符 串 的 集合 ， 并 在 节点 triangle/ 
jcr: content 下 ， 添 加 一 个 新 的 段落 。 在 这 种 情况 下 ， 我 们 可 以 做 到 以 下 几 点 : 


Node contentNode =triangleNode. getNode( "jcr:content") ; 





for (Iterator i= strings. iterator( ) ; i. hasNext( ) ; ) | 

String text =(String) i.next( ) ; 

Node paraNode =contentNode. addNode( "paragraph") ; paraNode. setProperty 
("text'", text); 

| 

对 于 从 字符 串 中 检索 出 来 的 每 一 个 字符 串 ， 创 建 一 个 新 节点 ， 称 为 段 ， 并 指 
定 一 个 称 为 文本 的 新 属性 ， 这 反 过 来 ， 被 分 配给 检索 出 来 的 字符 串 。 
3.5.1.5 添加 和 写 属 性 

要 添加 新 的 属性 ， 或 改变 一 个 节点 的 现 有 属性 的 值 ， 我 们 使 用 节点 的 set- 
Property 方法 ， 如 下 所 示 : 

Property setProperty (String name, Value value) 

设置 这 个 节点 的 指定 属性 到 一 个 指定 值 。 如 果 该 属性 还 不 存在 ， 则 创建 它 。 
该 属性 的 属性 类 型 是 由 这 个 节点 的 节点 类 型 指定 的 。 

如 果 所 提供 的 值 对 象 的 属性 类 型 与 需要 的 是 不 同 的 ， 那 么 会 尽 最 大 努力 尝试 
转换 。 如 果 转 换 失 败 ， 则 抛 出 一 个 ValueFormatException 异常 。 

如 果 此 节点 的 节点 类 型 并 不 表示 一 个 特定 的 属性 类 型 ， 那么 使 用 所 提供 的 值 
对 象 的 属性 类 型 ， 如 果 属 性 已 经 存在 (先前 已 经 设置 了 ) ， 那 么 使 用 新 值 和 新 的 
属性 类 型 。 

例如 ， 要 改变 一 个 葵 形 的 价格 为 200， 我 们 可 以 做 到 以 下 几 点 : 
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String path ="products/rhombus/jcr:content/myapp :price"; 
root. getProperty( path). setValue( 200 ) ; 

或 者 也 可 以 如 下 : 

String path ="products/rhombus/jcr:content'"; 

Node rhombus = root. getNode( path ) ; 


rhombus. setProperty( "myapp:price', 200)， 


3.5.1.6 移 除 节点 和 属性 


目标 ， 


单 什 


移 除 一 个 节点 或 属性 ， 通 过 Ttem. remove 方法 ， 如 下 : 

void remove () 

此 方法 会 删除 这 个 条 目 及 其 子 树 。 

要 坚持 删除 ， 必 须 执 行 一 个 保存 ， 其 中 包括 在 其 范围 内 ， 删 除 条 目的 父 。 

如 果 这 个 条 目 或 在 其 子 树 的 一 个 条 目 ， 在 这 个 工作 空间 ， 被 作为 一 个 引用 的 
保存 时 将 抛 出 一 个 ReferentialIntegrityException 异常 。 

通过 将 其 值 设 置 为 nul， 也 可 以 删除 一 个 属性 。 当 这 么 做 的 时 候 ， 针 对 一 个 

属性 ，null 参数 必须 转换 为 一 个 非 数 组 类 型 ， 而 针对 多 值 属性 ， 必 须 是 数组 














类 型 。 


同 的 。 
值 ， 
部 属 


3. S. 


的 位 


注意 ， 设 置 多 值 属 性 到 一 个 包含 空 值 的 数组 ， 与 将 它 设 置 为 空 数组 类 型 是 不 





在 前 一 种 情况 下 ， 组 内 的 所 有 s 值 将 被 删除 ， 数 组 被 压缩 为 只 包括 非 空 
即使 在 一 个 多 值 属性 中 的 结果 被 设置 为 一 个 空 数组 。 而 在 后 一 种 情况 下 ， 全 
性 被 删除 。 
例如 ， 


pb. setValue( ( String[ ] ) null) 

删除 属性 p， 而 

p. setValue( new String[ ] | "a', null, "b") ) 

将 设置 p 为 ['a",'b"] ,并且 

pb. setValue( new String[ | | null} ) 

将 设置 p 为 空 数组 []。 

1.7 移动 和 复制 

通过 会 话 和 工作 空间 接口 的 方法 ， 实 现 节 点 的 移动 和 复制 。 
会 话 提供 了 一 个 移动 方法 : 

void move (String srcAbsPath ，String destAbsPath ) 

移动 在 srcAbsPath 的 节点 及 其 整个 子 树 ， 到 destAbsPath 的 新 位 置 。 
为 了 保持 改变 ， 必 须 调用 会 话 或 一 个 共同 的 祖先 的 保存 方法 ， 在 源 和 目的 地 
置 上 。 

例如 ， 下 面 的 代码 : 





第 3 章 ”内容 仓 库 的 标准 化 接口 .67 . 





Workspace workspace 三 ... ; 

workspace. move ("/products/TV/Paragraph ", "/products/Radio/Para- 
graph ) ; 

将 移动 一 个 段落 ， 从 一 个 位 置 到 另 一 个 位 置 。 

workspace. copy 的 工作 方式 ， 同 上 类 似 。 


3.5.2 添加 和 删除 命名 空间 


在 级 别 2 的 内 容 仓 库 中 ， 有 能 力 添加 、 删 除 和 更 改 存储 在 命名 空间 注册 表 中 
的 命名 空间 集 ， 其 中 不 包括 内 置 的 、JCR 要 求 的 命名 空间 。 

级 别 2 的 目标 是 ， 为 实现 一 个 可 写 的 内 容 库 ， 完 成 所 需 的 功能 ， 但 不 创造 太 
多 的 负担 。 因 此 ， 保留 很 多 可 选 的 功能 由 内 容 管 理 系统 和 事务 系统 提供 。 

如 前 面 的 讨论 ， 每 个 内 容 仓 库 都 有 一 个 单一 的 、 持 久 的 命名 空间 注册 表 ， 通 
过 方法 Workspace. getNamespaceRegistry ( ) 返回 的 对 象 表示 。 在 级 别 1 中 ， 只 
NamespaceRegistry 发 现 信息 的 方法 必须 发 挥 作用 ， 而 在 级 别 2 中 ，Namespace- 
Registry 可 以 使 用 下 列 方法 ， 来 允许 命名 空间 映射 的 持久 性 的 变化 。 
3.5.2.1 注册 命名 空间 的 方法 

void registerNamespace (String prefix, String uri) 

在 这 个 仓库 的 全 局 命名 空间 注册 表 中 ， 设 置 一 个 prefix 和 uri 之 间 的 一 对 一 
映射 。 给 一 个 命名 空间 注册 表 中 已 经 存在 的 URI 分 配 一 个 新 的 前 级， 会 擦 除 旧 
的 前 级 。 

男 一 方面 ， 把 一 个 已 经 被 分 配 到 URI 的 前 级 重新 分 配 到 新 的 URI， 作 用 相当 
于 注销 该 URI 前 级 。 
3.5.2.2 删除 命名 空间 的 方法 

void unregisterNamespace (String prefix ) 

这 个 方法 用 于 从 注册 表 中 删除 一 个 命名 空间 上 映射， 会 有 以 下 限制 : 

1) 当 尝 试 注销 一 个 内 置 的 命名 空间 (jcr，nt，mix，xml 或 空 的 命名 空间 ) 
时 ， 将 抛 出 一 个 NamespaceException。 

2) 当 尝试 注销 一 个 命名 空间 ， 但 是 目前 存在 内 容 (或 者 在 一 个 条 目的 名 称 
或 者 在 一 个 名 称 或 路 径 属性 的 值 中 ) 时 ， 将 抛 出 一 个 NamespaceException 。 

一 旦 注册 ， 可 以 在 库 中 的 任何 节点 或 属性 的 名 称 中 使 用 前 级 。 使 用 提供 的 被 
映射 到 URI 的 前 缀 简写 。 因 为 URI 的 空间 是 全 局 管理 的 ， 每 个 仓库 命名 空间 和 
较 大 的 URI 命名 空间 的 组 合 ， 可 以 用 来 提供 唯一 性 的 全 局 的 节点 或 属性 名 称 。 
当然 ， 就 像 在 XML 命名 空间 的 情况 一 样 ， 确 保 这 种 普遍 的 独特 性 ， 要 求 应 用 程 
序 映射 到 应 用 程序 特定 的 前 级 ， 此 前 级 与 特定 应 用 程序 的 URI 是 唯一 确定 的 。 

命名 空间 注册 表 总 是 包含 至 少 以 下 内 置 的 映射 ， 这 是 无 法 通过 API 删除 的 : 
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1) jcr - > http: /www. jcp. org/jer1.0， 为 内 置 的 节点 类 型 定义 条 目 保 留 。 
例如 ，jer: content。 

2) nt - > http: /A/www. jep. org/jcr/nt/1.0, 为 内 置 的 主 节 点 类 型 的 名 称 
保留 。 

3) mix - > http: /A/www. jcp. org/jcr/mix/1.0， 为 内 置 混合 节点 类 型 的 名 称 
保留 。 

4) xml - > http: //www. w3. org/XML/1998/namespace， 与 XML 兼容 的 原因 
保留 。 

5) "(空前 级 ) - > "( 空 URI) ， 这 使 得 默认 命名 空间 为 空 的 URI。 实 际 上 ， 
这 意味 着 ,在 其 前 缀 形式 和 它 的 完全 限定 形式 上 ,没有 前 级 的 名 称 是 相同 的 。 


3.5.3 ”导入 仓库 内 容 


级 别 2 的 仓库 必须 支持 从 标准 的 XML 映射 (系统 视图 或 文档 视图 ) 的 内 容 
导入 。 

级 别 2 允许 任意 XML 文件 ， 作 为 一 个 节点 和 属性 的 树 ， 导 入 到 仓库 。 如 果 
一 个 XML 文档 以 JCR 中 系统 视图 形式 ， 那 么 导入 相当 于 从 备份 的 恢复 操作 ， 完 
成 了 从 级 别 1 的 XML 导出 功能 的 往返 。 和 否则 ，XML 导入 处 理 过 程 就 好 像 它 是 一 
个 文档 视图 ,添加 XML 命名 空间 声明 到 仓库 的 命名 空间 注册 表 ， 并 创建 一 个 
JCR 节点 和 属性 的 树 ， 并 用 XML 文档 的 结构 和 名 称 相 匹 配 树 。 


3.5.4 分配 节 点 类 型 


级 别 2 兼容 的 实现 必须 支持 在 创建 节点 的 时 候 ， 为 节点 分 配 主要 和 混合 节点 
类 型 ， 可 选 的 实现 从 现 有 的 节点 分 配 和 清除 混合 节点 类 型 。 

级 别 2 提供 分 配 主要 和 混合 类 型 到 节点 的 方法 。 在 某 些 情况 下 ， 类 型 分 配 将 
自动 根据 节点 的 父 节 点 类 型 定义 。 例 如 ， 如 果 一 个 节点 类 型 需要 其 子 节 点 的 所 有 
主要 类 型 为 “my: customer”， 那 么 任何 为 该 节点 创建 的 子 节点 将 默认 为 这 个 主 
要 类 型 ,任何 给 这 个 子 节 点 添加 一 些 其 他 主要 类 型 的 企图 ， 都 将 导致 异常 。 因 
此 ， 节 点 类 型 可 以 被 用 来 执行 对 内 容 的 数据 类 型 约束 。 

3.5.5 ”线程 安全 性 要 求 

一 个 内 容 仓库 的 实现 ， 需要 为 所 有 的 javax. jcr. Repository 方法 ， 提供 一 个 线 
程 安 全 的 实现 。 一 个 内 容 仓库 的 实现 不 需要 提供 其 他 接口 的 线程 安全 的 实现 ， 因 
此 ， 一 个 应 用 程序 同时 或 先后 对 一 个 特定 的 Session 对 象 通过 多 个 线程 操作 ， 必 
须 提供 足够 的 同步 ， 以 确保 不 超过 一 个 线程 同时 工作 ， 会 话 和 由 一 个 线程 所 做 的 
更 改 对 其 他 线程 是 可 见 的 。 
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3.6 可 选 的 仓库 功能 


JCR 为 作为 可 选 功能 的 附加 内 容 服务 ， 提 供 了 一 个 标准 接口 。 本 节 提 供 了 一 
个 内 容 仓库 实现 支持 的 可 选 功能 的 概述 。 它 们 是 事务 、 版 本 化 、 观 察 、 锁 定 和 
SQL 语法 搜索 。 这 些 功 能 都 没有 任何 依赖 对 方 或 任何 级 别 2 的 功能 ， 因 此 这 五 个 
可 以 任意 组 合 ， 被 级 别 1 或 级 别 2 支持 。 


3.6.1 事务 


一 个 标准 的 内 容 仓库 可 以 支持 事务 。 如 果 它 这 样 做 ， 就 必须 遵循 Java 事务 
API (JTA) 规范 ， 规 范 见 http: /Vjava. sun. com/products/jta/index. html。 通 过 对 
JTA 的 支持 ， 来 实现 事务 。 

一 个 特定 的 内 容 仓 库 实现 是 否 支 持 事 务 ， 可 以 通过 查询 仓库 描述 符 表 ,使 用 
方法 : 

Repository. getDescriptor ( "OPTION_TRANSACTIONS_SUPPORTED") 

一 个 为 true 的 返回 值 表示 事务 的 支持 。 

在 本 规范 中 ,没有 定义 实际 的 方法 ， 用 来 控制 事务 边界 ， 这 是 为 什么 没有 
begin 、commit 或 rollback 方法 在 这 个 API 的 原因 。 这 些 方法 是 由 JTA 规范 来 定 
义 的 。 

JTA 为 事务 提供 两 种 常用 的 方法 : 容器 管理 的 事务 和 用 户 管理 的 事务 。 在 第 
一 种 情况 下 ， 事 务 管理 由 应 用 程序 服务 器 来 管理 ， 对 使 用 API 的 应 用 程序 是 完 
全 透明 的 。JTA 的 接口 javax. transaction. TransactionManager 和 javax. transaction. 
Transaction 是 关于 这 方面 的 5 当然 5 对 于 客户 端 而 言 5 将 永远 不 会 需要 使 用 这 些 
接口 。 

在 第 二 种 情况 下 ,使 用 API 的 应 用 程序 可 以 选择 来 控制 从 应 用 程序 内 的 事务 
边界 。 在 这 种 情况 下 ， 相 关 的 接口 是 javax. transaction. UserTransaction 。 这 个 接口 
提供 方法 ， 包 括 begin 、commit 、rollback 等 。 

一 个 JCR 的 内 容 仓库 实现 ， 如 果 它 提供 事务 功能 ， 必 须 支 持 这 两 种 方法 。 


3. 6.2 版 本 化 


一 个 标准 的 内 容 仓库 可 以 支持 版 本 。 此 功能 允许 记录 一 个 节点 的 状态 ， 这 样 
以 后 就 可 以 恢复 。 在 JSR-147 中 定义 了 工作 空间 版 本 和 配置 管理 API， 之 后 就 可 
以 建 模版 本 系统 。 

一 个 特定 的 内 容 仓 库 实现 是 否 支 持 版 本 ， 可 以 通过 查询 仓库 描述 符 表 ， 使 用 
方法 : 
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Repository. getDescriptor ("OPTION_ VERSIONING_ SUPPORTED") 

一 个 为 true 的 返回 值 表示 版 本 的 支持 。 

一 个 支持 版 本 的 仓库 ， 除 了 一 个 或 多 个 工作 空间 外 ， 还 有 一 个 特殊 的 版 本 存 
储 区 。 版 本 存储 区 保护 版 本 历史 。 在 不 同 的 工作 空间 的 多 版 本 节点 共享 同一 版 本 
的 历史 ， 当 且 仅 当 它们 有 相同 的 UUID。 

一 个 版 本 的 历史 ， 是 一 个 连接 到 另 一 个 版 本 的 继承 关系 的 集合 。 当 一 个 版 本 
化 的 节点 ， 其 工作 空间 实例 之 一 被 检 入 的 时 候 ， 新 版 本 增加 到 版 本 历史 。 每 一 个 
附加 到 版 本 历史 的 新 版 本 作为 一 个 (或 更 多 ) 现 有 版 本 的 继任 者 。 其 结果 是 ， 
一 个 版 本 的 历史 是 一 个 版 本 的 有 向 无 环 图 ， 图 中 的 弧 代表 继承 关系 。 

版 本 存储 对 象 本 里 定义 为 节点 。 虽 然 每 个 仓库 ， 只 有 一 个 版 本 存储 ， 版 本 存 
储 的 数据 反映 在 每 个 工作 空间 ， 作 为 一 个 特殊 的 、 受 保护 的 、 类 型 为 nt: ver- 
sionHistory 和 nt: version 的 节点 的 子 树 。 

当 一 个 版 本 化 的 节点 被 检 入 〈 使 用 Node. checkin) 时 ， 在 该 节点 的 版 本 历史 
中 ， 创 建 一 个 新 的 版 本 。 多 版 本 节点 也 设置 为 只 读 。 为 了 改变 它 使 用 常规 的 
write 方法 ， 它 必须 检 出 (使 用 Node. checkout) 。 一 个 版 本 化 的 节点 也 可 以 使 用 
Node. restore， 人 恢复 其 版 本 记录 的 状态 。 


3.6.3 观察 


一 个 标准 的 内 容 仓 库 可 以 支持 观察 (Observation ) 。 此 功能 允许 应 用 程序 注 
册 兴 趣 到 工作 空间 的 变化 事件 描述 中 ， 然 后 监视 和 响应 这 些 事 件 。 当 一 个 持久 的 
变化 到 工作 空间 时 ， 观 察 机 制 调度 事件 。 
一 个 特定 的 内 容 仓库 实现 是 否 文 持 观察 ， 可 以 通过 查询 仓库 描述 符 表 ， 使 用 
方法 : 
Repository. getDescriptor ( "OPIION_OBSERVATION_SUPPORTED") 
一 个 为 true 的 返回 值 表示 观察 的 支持 。 
需要 注意 的 是 ， 在 那些 支持 事务 的 仓库 中 ， 只 有 在 一 个 事务 中 所 做 的 更 改 的 
情况 下 ， 相 应 的 事件 才 会 被 调度 去 提交 事务 。 而 在 事务 外 部 所 做 的 更 改 的 情况 
下 ， 相 应 的 事件 将 在 保存 时 调度 ， 如 果 是 直接 存 到 工作 空间 的 情况 下 ， 也 会 立即 
调度 。 
一 个 实现 了 事件 接口 的 对 象 ， 代 表 由 仓库 生成 的 事件 。 它 还 包含 常数 ， 代 表 
五 个 事件 类 型 。 


3.6.4 锁定 


在 那些 支持 它 的 仓库 中 ， 锁 定 允 许 用 户 暂 时 锁定 节点 ， 以 防止 其 他 用 户 改 变 
它们 。 
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此 功能 通常 用 于 序列 化 访问 一 个 节点 ， 以 防止 “丢失 更 新 间 题 ”。 虽 然 在 标 
准 的 JCR 级 别 2 中 ,已 经 通过 InvalidltemStateException 来 阻止 这 种 仓库 内 容 的 不 
慎 覆 盖 ， 但 使 用 锁定 可 以 第 一 时 间 避 免 异常 发 生 。 


3.6.5 SQL 语法 搜索 


SQL 搜索 提供 一 个 额外 的 查询 语言 ， 超 越 了 级 别 1 的 XPath 搜索 。 一 个 内 容 
仓库 ,不 管 是 级 别 1 或 级 别 2， 都 可 支持 使 用 SQL 查询 语法 的 搜索 。 

一 个 特定 的 内 容 仓 库 实现 是 否 支 持 SQL， 可 以 通过 查询 仓库 描述 符 表 ， 使 用 
方法 » 

Repository. getDescriptor ("OPTION_ QUERY_ SQL_ SUPPORTED") 

一 个 为 true 的 返回 值 表示 SQL 的 支持 。 


3.7 非 功能 

















任何 遵循 JCR 标准 规范 的 软件 产品 ， 都 要 实现 规范 要 求 的 两 个 兼容 级 别 和 
一 组 额外 的 可 选 功能 。 如 同 任 何 精心 设计 的 标准 规范 一 样 ，JCR 的 接口 只 定义 了 
针对 独立 开发 的 系统 之 间 的 互 操作 性 以 及 需要 的 功能 ， 但 它 没有 定义 供应 商 必 须 
如 何 实现 使 用 内 容 仓库 的 应 用 程序 ， 其 中 包括 许多 管理 应 用 程序 。 因 此 ， 除 了 要 
实现 规范 要 求 的 两 个 兼容 级 别 和 一 组 额外 的 可 选 功能 外 ， 还 需要 实现 使 用 内 容 仓 
库 的 应 用 程序 的 附加 功能 ， 内 容 仓库 供应 商 将 需要 实现 管理 系统 仓库 本 身 。 这 些 
“ 非 功 能 ”包括 : 

1) 管理 工作 空间 的 创建 、 删 除 和 命名 。JCR 不 提供 一 种 手段 ， 来 创建 一 个 
命名 的 工作 空间 ， 改 变 工作 空间 的 名 称 ， 或 删除 工作 空间 。 管 理 任务 通常 是 针对 
特定 的 一 个 仓库 的 实现 ， 并 处 于 应 用 程序 接口 的 范围 外 ; 出 于 同样 的 原因 ， 创 建 
文件 系统 (磁盘 格式 ) 也 处 于 文件 API 的 范围 之 外 。 

2) 管理 节点 类 型 。JCR 没有 提供 定义 、 创 建 或 管理 节点 类 型 的 方法 。 广 泛 
用 于 在 现 有 的 内 容 仓库 类 型 实体 的 方法 ， 使 得 它 很 难为 节点 类 型 配置 定义 一 个 独 
立 机 制 。 因 此 ，JCR 本 身 限 制 节点 类 型 的 分 配 和 发 现 。 

3) 管理 用 户 和 访问 控制 列表 。 设 计 JCR 的 目的 是 为 了 使 用 现 有 的 访问 控制 
系统 ， 而 不 是 发 明 一 个 特有 的 仓库 API。 然 而 ， 也 可 以 为 自己 的 内 容 , 来 实现 一 
些 访问 控制 。 

4) 工作 流 。 工 作 流 ， 又 名 业务 流程 自动 化 ， 是 一 个 高 级 内 容 管理 系统 常见 
的 应 用 功能 。 许 多 JCR 支持 的 功能 ， 如 观察 ， 是 特别 需要 工作 流 引擎 的 ， 但 引 
擎 本 身 及 其 相关 的 管理 职能 不 属于 JCR 接口 的 一 部 分 。 

5) 语义 信息 模型 。JCR 中 不 承担 或 不 要 求 任何 通过 接口 交换 内 容 。 应 用 程 
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序 可 能 会 产生 这 样 的 语义 信息 模型 ， 并 可 能 会 限制 自己 以 及 它们 的 节点 类 型 服从 
这 些 模 型 ， 但 JCR 并 不 做 要 求 。 

除了 上 面 提 到 的 非 功 能 ，JCR 还 经 常 被 误 认 为 是 一 个 网 络 协议 或 HTTP 或 
WebDAYV 的 一 个 蔡 代 品 。JCR 的 相互 作用 发 生 在 J2SE/J2EE 环境 ， 尽 管 它们 可 能 
被 映射 到 一 个 应 用 层 的 网 络 协议 ， 但 这 不 是 一 个 内 容 仓 库 API 的 目标 。 当 Web- 
DAYV 被 用 来 作为 一 种 基于 JCR 的 内 容 仓库 的 蔡 代 接口 ，JCR 的 角色 相对 于 Web- 
DAYV 协议 ， 类 似 于 有 关 java Servlet 接口 到 HTTP 的 作用 。 


第 4 昔 内 容 管理 互 操作 性 服务 


内 容 管理 互 操作 性 服务 (Content Management Interoperability Services ，CMIS ) 
是 一 个 规范 ， 旨 在 定义 一 个 标准 化 的 方法 访问 内 容 库 ， 独 立 于 供应 商 、 平 台 和 编 
程 语言 。CMIS 标准 定义 了 一 个 域 模型 和 一 套 基 于 REST 架构 的 Web 服务 ， 包 括 
Web 服务 ( Web Services) 和 表述 性 状态 转移 ( Representational State Transfer， 
REST) 风格 的 AtomPub 包 ， 应 用 程序 可 以 使 用 CMIS 与 一 个 或 多 个 内 容 管理 库 / 
系统 交互 。 

CMIS 接口 被 设计 构建 在 现 有 的 内 容 管理 系统 和 已 存在 的 可 编程 接口 的 上 层 。 
它 的 目的 不 是 要 规定 如 何在 这 些 CM 系统 中 实现 这 些 具体 功能 ， 也 不 是 要 通过 
CMIS 接口 详尽 地 揭露 CM 系统 的 所 有 功能 。 相 反 ， 它 的 目的 是 定义 一 套 应 由 CM 
系统 提供 的 、 通 用 /普及 的 功能 集 ， 以 及 一 组 使 用 这 些 功 能 的 服务 集 。 

















4.1 CMIS 概述 


4.1.1 CMIS 的 历史 


在 2008 年 ， 一 个 有 影响 力 的 内 容 管理 系统 供应 商 小 组 ， 给 全 世界 带 来 了 惊 
喜 。 他 们 宣布 将 提交 一 份 新 的 规范 ， 称 为 内 容 管理 互 操作 性 服务 (Content Man- 
agement Interoperability Services，CMIS) ， 以 下 简称 CMIS， 此 规范 递交 给 OASIS 
(Organization for the Advancement of Structured Information Standards ， 结 构 化 信息 
标准 促进 组 织 ) 联盟 进行 审查 和 批准 。 

小 组 的 最 初 成 员 包 括 EMC 公司 、IBM 公司 、 微 软 公 司 等 ， 联 合 新 闻 公 报 发 
布 后 ， 很 快 其 他 的 ECM 厂商 ， 包 括 Alfresco 公司 、OpenText 公司 、Oracle 公司 、 
SAP 公司 以 及 许多 其 他 广 商 ， 立 即 也 加 入 了 标准 化 制定 工作 ， 并 随 之 发 布 公告 。 

2010 年 10 月 ， 内 容 管理 互 操作 性 服务 (CMIS) 1.0 版 已 经 由 OASIS 批准 ， 
基于 此 规范 的 实现 ,正在 被 一 些 主要 供应 商 作为 产品 的 一 部 分 开始 提供 。 在 规范 
还 处 于 一 个 非常 初步 的 阶段 时 ， 但 很 多 厂商 在 规范 起 草 时 ， 已 开始 其 实现 工作 ， 
不 断 持 续 提 炼 代码 ， 并 根据 每 一 个 新 的 草案 版 本 迅速 更 新 。 

CMIS 规范 的 全 文 可 参考 . http: //docs. 0asis-open. org/cmis/ CMIS/v1. 0/os/ 
cmis- spec-v1. 0. pdf。 

CMIS 是 一 个 “年 轻 ” 的 标准 。 然 而 在 它 的 背后 ， 已 经 有 许多 ECM 厂商 加 
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入 规范 化 工作 ， 并 承诺 在 即将 到 来 的 产品 版 本 中 ， 全 力 支 持 它 。 但 毕竟 是 一 个 新 
的 规范 ，CMIS 是 否 能 真 的 长 期 的 成 功 ， 还 有 待 进一步 观察 。 

此 外 ，CMIS 规范 1.0 版 本 的 范围 是 故意 设计 得 非常 有 限 ， 忽 略 掉 一 些 领域 。 
其 中 的 原因 在 于 技术 委员 会 的 成 员 希 望 能 在 合理 的 时 间 内 完成 他 们 的 工作 ， 并 给 
软件 供应 商 有 机 会 迅速 实现 它 。 所 以 ， 如 果 你 开始 认真 地 参考 使 用 CMIS ， 很 快 
就 会 发 现 ， 有 一 些 功 能 ， 你 不 能 单独 通过 CMIS 来 达到 。 

了 解 CMIS 的 历史 和 背景 ， 有 助 于 我 们 理解 和 探讨 设计 CMIS 是 来 解决 什么 
样 的 问题 的 ， 以 及 如 何 使 用 它 来 实现 现实 世界 的 应 用 。 


4.1.2 CMIS 的 目标 














在 CMIS 规范 的 正文 起 始 ， 有 一 段 描述 : “CMIS is intended to define a gener- 
ic/ universal set of capabilities provided by a CM system and a set of services for work- 
ing with those capabilities. ”翻译 为 中 文 ， 就 是 “CMIS 的 目的 是 定义 一 套 CM 系 
统 提 供 的 通用 /普遍 的 能 力 集 ， 以 及 与 这 些 能 力 一 起 工作 的 服务 集 ”。 

从 中 可 以 理解 ，CMIS 的 主要 目的 是 描述 每 一 个 内 容 管理 系统 可 以 提供 的 功 
能 ， 至 少 在 理论 上 。 因 此 ， 遵 守 CMIS 不 存在 不 同 层次 ， 如 “核心 ”级 别 和 一 个 
或 多 个 “高 级 ”级 别 。 一 个 实现 要 么 是 完全 兼容 的 ， 要 么 是 完全 不 符合 的 。 

即便 如 此 ， 也 有 多 项 功能 是 实现 者 没有 义务 提供 的 ， 具体 可 以 参考 标准 文本 
里 面 的 “MAY” 和 “SHOULD”。“MAY” 代 表 可 能 ,“SHOULD” 代 表 应 该 和 必 
须 。 然 而 ， 一 个 服务 需 必 须 始终 明确 哪些 功能 它 支 持 或 不 支持 。 例 如 ， 有 些 库 是 
能 够 进行 全 文 检索 ， 而 其 他 库 则 不 支持 。 任 何 客户 端 可 以 询问 服务 器 ， 哪 些 功能 
它 支 持 ， 并 采取 相应 的 行动 。 例 如 ， 对 于 不 支持 特定 应 用 所 需 的 所 有 能 力 的 服务 
器 ， 可 以 降低 其 功能 或 拒绝 与 服务 器 工作 。 

考虑 到 这 一 点 ， 让 我 们 来 看 看 CMIS 指定 了 什么 : 

1) 一 个 可 扩展 的 域 模 型 ， 它 描述 了 一 个 仓库 能 包含 的 对 象 和 它们 关系 的 
类 型 。 

2) 一 个 执行 搜索 的 查询 语言 。 

3) 一 套 协议 绑 定 ， 为 客户 与 服务 器 在 网 络 上 交互 。 

4) 一 些 服务 和 方法 集 ， 客 户 可 以 呼叫 服务 器 来 执行 仓库 库 操 作 。 

CMIS 定义 的 服务 被 设计 允许 客户 端 : 

1) 操作 内 容 ， 创 建 、 读 取 、 更 新 、 删 除 内 容 ， 内 容 包括 文件 和 文件 夹 。 

2) 通过 属性 (元 数据 ) 描述 内 容 。 

3) 遵循 和 操作 内 容 项 之 间 的 关系 。 

4) 基于 层次 文件 夹 结构 ， 使 用 经 典 的 文件 系统 导航 内 容 。 

5) 搜索 库 , 使 用 属性 或 内 容 本 身 。 
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6) 执行 协作 动作 ， 如 检 入 和 检 出 。 
7) 操纵 策略 和 与 内 容 项 目 相关 的 访问 权限 。 


4.1.3 CMIS 中 没有 包括 的 功能 


正如 我 们 前 面 提 到 的 ，CMIS 不 包括 某 些 功能 设计 ， 也 许 只 有 几 个 厂商 已 经 
实现 ,或 很 难 基于 一 个 独立 于 供应 商 的 方式 指定 。 下 面 是 其 中 一 些 . 

1) 修改 域 模型 的 能 

2) 数字 资产 管理 (DAM) 功能 ， 比 如 流 。 

3) 记录 管理 功能 ， 比 如 保留 时 间 表 。 

4) 订阅 服务 、 通 知 、 触 发 器 。 

5) Web 内 容 管理 功能 ， 如 模板 、 阶 段 和 部 署 。 

6) 一 个 SQL 完全 兼容 的 查询 语言 。 

在 CMIS 的 未 来 版 本 中 ， 可 能 会 解决 这 些 问 题 ， 可 能 还 有 其 他 的 ， 但 就 目前 
而 言 ， 和 暂时 没有 任何 打算 重新 召集 了 一 个 技术 委员 会 ， 以 便 起 草 CMIS2. 0。 








4.2 CMIS 和 JCR 的 对 比 


关于 内 容 仓库 的 规范 ， 目 前 只 有 2 种 ， 一 个 是 JCR， 男 一 个 就 是 CMIS。 

从 时 间 上 来 看 ， 早 在 2005 年 ，JCP 就 提出 JSR-170 作为 JCR1. 0 规范 ， 最 近 
又 提出 一 个 更 全 面 的 JSR-283 作为 JCR 2. 0 版 本 ，JCR 定义 了 一 套 操 作 内 容 仓库 
的 Java 标准 API， 比 CMIS 更 加 成 熟 的 规范 ， 具 有 丰富 的 功能 集 。 

但 使 用 JCR， 也 有 一 些 不 足 之 处 ，JCR 是 一 个 纯 Java 的 API， 只 能 在 Java 环 
境 中 使 用 ， 意 味 着 与 语言 和 平台 相关 ; 其 次 ，JCR 的 设计 也 成 为 本 质 上 是 一 个 进 
程 的 API， 这 意味 着 客户 端 和 服务 器 需要 驻 留 在 同一 个 Java 虚拟 机 。 

而 CMIS 的 设计 目的 是 完全 与 语言 和 平台 无 关 ，CMIS 可 以 在 Web 上 使 用 。 

事实 上 , JCR 只 是 被 基于 Java 的 内 容 管理 系统 供应 商 所 采纳 ， 包 括 Day Soft- 
ware 公司 、Hippo 公司 、eXo 公司 等 ， 但 不 是 全 部 厂商 。 比 如 ，Alfresco 公司 已 经 
提供 了 一 个 JCR API 很 长 一 段 时 间 ， 但 是 ， 据 我 们 所 知 ， 目 前 还 没有 计划 将 它 升 
级 到 JCR 2. 0。 作 为 一 个 这 样 的 后 果 ， 如 果 你 想 开 发 一 个 应 用 程序 ， 通 过 Web 网 
络 连 接 到 一 个 内 容 仓库 服务 器 ， 选 择 CMIS 是 一 个 较 好 的 方案 。 
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CMIS 为 应 用 程序 访问 一 个 仓库 提供 了 一 个 接口 。 为 了 实现 这 一 目标 ，CMIS 
规范 定义 了 一 个 核心 数据 模型 ， 即 域 模型 。 域 模型 描述 持久 性 的 信息 实体 ， 这 些 


"76. 企业 内 容 管理 理论 与 实践 





信息 实体 对 象 组 成 一 个 典型 的 内 容 管理 系统 的 域 ， 包 括 文档 、 文 件 夹 、 关 系 和 策 
略 。 它 们 由 仓库 管理 ， 并 指定 了 一 套 基 本 的 服务 ， 应 用 程序 可 以 使 用 它 来 访问 和 
操纵 这 些 实体 。 

一 个 CMIS 的 类 型 由 其 名 称 确定 ， 通 过 其 属性 定义 。 每 个 对 象 本 身 都 有 一 个 
标识 符 、 类 型 、 显 示 名 称 和 属性 ， 例 如 是 否 需 要 ， 或 可 以 有 多 个 值 等 。 除 了 在 
CMIS 规范 中 包含 的 类 型 ， 实 现 者 可 以 自由 扩展 域 模型 ， 使 用 上 自己 的 自 定 义 类 型 ， 
从 基本 的 类 型 派生 。 


4.3.1 仓库 


代表 仓库 本 喘 ， 属 性 包括 仓库 ID、 仓 库 显 示 名 称 、 仓 库 描述 信息 、 厂 商 、 
产品 名 称 、 产 品 版 本 、 根 文件 夹 D、 能 力 列表 、 最 近 修 改 日 志 、CMIS 版 本 文 
持 、URI 等 。 通 过 CMIS 的 getRepositoryInfo 服务 ， 可 以 充分 获取 仓库 本 身 的 
诗 自 


日 / 心 \o 


4. 3. 2 ”对象 


通过 CMIS 管理 的 实体 被 建 模 为 对 象 类 型 。 在 CMIS 仓库 中 的 每 个 对 象 都 有 
个 唯一 的 、 一 成 不 变 的 标识 符 ， 在 对 象 的 生命 周期 间 ， 应 该 不 会 改变 。 建 议 即 
使 在 原始 对 象 已 被 删除 的 情况 下 ， 也 不 要 重用 对 象 标识 符 。 除 了 有 一 个 不 变 的 标 
识 符 外 ， 对 象 还 要 有 一 个 所 谓 的 查询 名 称 ， 用 于 查询 和 过 滤 ; 还 要 有 一 个 显示 名 
称 ， 应 用 程序 用 作 一 个 字段 标签 ， 或 作为 报告 中 的 列 标题 。 

有 四 种 基本 的 对 象 类 型 : 文档 对 象 、 文 件 夹 对 象 、 关 系 对 象 和 策略 对 象 : 

1) 一 个 文档 对 象 代表 一 个 独立 的 信息 资产 ,文档 对 象 是 由 CMIS 仓库 管理 
的 基本 实体 。 

2) 一 个 文件 夹 对 象 代 表 了 一 个 “可 存档 ”对 象 集合 的 逻辑 容器 ， 其 中 包括 
文件 夹 对 象 和 文档 对 象 。 文 件 夹 对 象 用 来 组 织 “ 可 存档 ”对 象 ， 一 个 对 象 是 否 
是 “可 存档 ” ， 由 其 对 象 类 型 定义 指定 。 

3) 一 个 关系 对 象 表示 的 是 两 个 对 象 之 间 定 向 关系 的 一 个 实例 。 关 系 对 象 的 
支持 是 可 选 的 ， 可 以 通过 “获取 子 类 型 ”服务 发 现 。 

4) 一 个 策略 对 象 代表 一 个 行 策略 ， 它 可 以 被 应 用 到 一 个 或 多 个 “可 控 策 
略 ” 对 象 。 一 个 对 象 是 否 是 可 控 的 ， 在 其 对 象 类 型 定义 中 指定 。 策 略 对 象 的 文 
持 是 可 选 的 ， 可 以 通过 “获取 子 类 型 ”服务 发 现 。 

每 个 对 象 都 属于 如 上 所 述 的 四 种 类 型 之 一 ， 或 从 这 些 派 生 的 类 型 ， 在 CMIS 
中 的 对 象 是 强 类 型 ， 如 果 客 户 端 为 一 个 不 在 类 型 支持 的 属性 列表 中 的 属性 指定 了 
一 个 值 ， 服 务 器 一 定 会 报告 错误 。 

除了 上 面 刚才 所 描述 的 四 个 基本 类 型 ， 还 可 以 定义 更 多 的 对 象 类 型 。 每 个 自 
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定义 对 象 类 型 扩展 基本 类 型 之 一 或 其 他 上 自 定 义 类 型 ， 从 而 给 从 其 父 继承 的 类 型 增 
加 新 的 属性 。 


4. 3.3 ”对象 类 型 


一 个 对 象 类 型 定义 了 一 套 固定 和 非 分 层 的 属性 集 ， 也 称 “ 模 式 ”， 即 该 
类 型 的 对 象 都 拥有 的 属性 集 。 仓 库 用 这 个 模式 来 验证 对 象 和 实施 约束 ， 也 被 
用 户 用 来 编写 基于 对 象 类 型 的 查询 。 所 有 的 CMIS 对 象 是 强 类 型 的 。 如 果 一 
个 应 用 程序 使 用 一 个 没有 在 对 象 类 型 定义 中 指定 的 属性 , 会 有 一 个 异常 被 
抛 出 。 

在 CMIS 中 的 每 个 对 象 类 型 ， 通 过 它 可 以 有 的 属性 集 来 定义 。 每 个 属性 是 一 
个 命名 的 、 类 型 的 容器 ， 有 零 个 、 一 个 或 多 个 值 。 一 个 没有 值 的 属性 被 说 成 是 
“value not set” 的 状态 。 在 CMIS 中 ， 没 有 空 值 的 概念 。 

多 值 属性 是 可 能 的 ， 但 作为 一 个 整体 ， 它 们 必须 在 “value set” 或 “value 
not set” 的 状态 。 在 一 个 多 值 列 表 中 单个 值 是 未 设置 ， 这 是 不 可 能 的 。CMIS 定 
义 的 属性 类 型 包括 字符 串 、 布 尔 值 、 小 数 、 整 数 、 日 期 时 间 、URI、ID 和 HT- 
ML; 与 对 象 类 似 ， 属 性 必须 有 一 个 查询 名 称 ， 将 在 查询 中 使 用 它 。 


4.3.4 文档 对 象 


文档 对 象 的 是 仓库 管理 的 基本 信息 实体 。 文 档 可 以 有 内 容 ， 事实 上 ， 也 是 唯 
一 可 以 有 内 容 的 对 象 类 型 。 

文档 也 是 可 以 唯一 可 以 进行 版 本 化 的 对 象 类 型 ， 它 们 也 可 以 是 可 存档 的 ， 这 
意味 着 可 以 包含 在 一 个 或 多 个 文件 夹 中 ; 通过 使 用 发 现 服务 实现 可 查询 的 ; 并 最 
终 通 过 策略 和 访问 控制 列表 (ACL) 来 实现 可 控 的 。 根 据 其 对 象 类 型 定义 ,一 个 
文档 对 象 可 能 是 : 

1) 能 版 本 化 : 可 通过 版 本 服务 操作 , 例如， 检 出 (checkout)， 检 入 
(checkin ) 。 

2) 能 存档 化 : 可 存档 零 个 、 一 个 或 多 个 文件 夹 ， 通 过 多 存档 服务 。 

3) 可 查询 : 可 通过 发 现 服务 (查询 ) 定位 。 

4) 可 控 的 策略 : 可 以 应 用 到 它 的 策略 。 

5) 可 控 的 ACL: 可 以 有 一 个 ACL 应 用 到 它 。 

此 外 ， 在 文档 对 象 的 对 象 类 型 定义 中 ， 必 须 、 可 以 或 不 能 有 一 个 指定 的 内 容 
流 。 一 个 文档 对 象 可 以 关联 到 零 个 或 多 个 样式 。 

需要 注意 的 是 ， 当 一 个 文档 是 可 版 本 化 时 ， 文 档 的 每 个 版 本 都 是 一 个 单独 的 
文档 对 象 。 因 此 ， 对 于 文档 对 象 ， 一 个 对 象 ID 实际 上 标识 了 一 个 文档 的 特定 
版 本 。 
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4. 3.5 文件 夹 对 象 


一 个 文件 夹 对 象 代 表 了 一 个 “可 存档 ”对 象 集合 的 逻辑 容器 ， 文 件 夹 对 象 
也 隐 含 在 此 集合 中 ， 每 个 对 象 都 有 一 定 的 层次 关系 ， 文 件 夹 对 象 称 为 父 对 象 ， 在 
集合 中 每 个 对 象 称 为 子 对 象 。 这 种 隐 含 的 关系 有 具体 的 包含 语义 ， 要 求 必须 保持 
隐 含 的 参照 完整 性 。 

文件 夹 类 似 文件 ， 不 言 自明 ， 不同 于 文件 ,文件 夹 不 能 有 内 容 流 ， 也 不 能 进 
行 版 本 化 ， 但 它们 可 以 拥有 零 个 或 多 个 描述 ， 当 然 ， 它 们 可 以 有 子 文件 夹 和 
文件 。 

每 个 仓库 都 必须 有 一 个 根 文件 夹 。 根 文件 夹 中 没有 任何 父 文件 来， 而 所 有 其 
他 的 文件 夹 必须 有 一 个 父 文件 来。 不 是 文件 夹 的 对 象 ， 反 而 可 以 有 多 个 父 文件 夹 
( 如果 仓库 具有 多 存档 能 力 ) 。 在 一 个 文件 夹 树 中 ,不 能 有 任何 循环 关系 。 换 名 
话说 ， 一 个 文件 夹 不 能 是 本 身 的 后 代 ， 只 有 文件 夹 可 以 有 子 文件 夹 。 


4.3.6 关系 对 象 


关系 是 用 来 定义 一 些 对 象 之 间 的 关联 或 链接 ， 它 们 有 一 个 类 型 、 源 对 象 和 目 
标 对 象 。 关 系 是 被 作为 对 象 进行 管理 的 ， 与 它们 联系 在 一 起 的 对 象 分 开 。 创 建 或 
删除 一 个 关系 ， 不 应 该 影响 相关 对 象 ， 它 们 保持 独立 。 事 实 上 ， 一 个 仓库 有 可 能 
允许 关系 的 操纵 ， 即 使 它 不 允许 我 们 更 新 其 他 对 象 。 一 个 关系 对 象 语义 上 是 一 个 
依赖 对 象 。 一 个 关系 对 象 必 须 不 能 有 一 个 内 容 流 ， 必 须 不 能 版 本 化 ， 可 以 是 可 查 
询 的 ， 不 能 被 存档 ， 但 它 可 能 是 可 控 的 。 

如 果 一 个 仓库 不 支持 关系 对 象 ， 调 用 一 个 “获取 类 型 ”服务 ， 应 该 不 会 返 
回 关系 基础 对 象 类 型 。 一 个 关系 对 象 ， 在 源 对 象 和 目标 对 象 之 间 ， 实 例 化 一 个 明 
确 的 、 二 进 制 、 定 向 、 非 侵入 性 的 和 类 型 化 的 关系 。 源 对 象 和 目标 对 象 都 必须 是 
独立 的 对 象 ， 如 文档 对 象 、 文 件 夹 对 象 或 策略 对 象 。 策 略 对 象 是 否 被 允许 作为 一 
个 关系 对 象 的 源 或 目标 对 象 ， 是 由 仓库 指定 的 。 


4.3.7 策略 对 象 


一 个 策略 对 象 代表 一 个 仓库 可 以 执行 的 管理 策略 ， 这 个 策略 可 以 是 仓库 强制 
的 ， 如 保留 管理 策略 。CMIS 规范 不 指定 专门 支持 的 各 种 行 策略 ， 也 不 试图 模拟 
任何 特定 种 类 的 行 策略 ， 只 有 一 个 基本 的 对 象 类 型 被 指定 为 策略 对 象 。 

在 CMIS 中 管理 策略 的 方式 是 通过 策略 的 文字 描述 ， 每 个 策略 对 象 保留 一 个 
行 策略 的 文本 ， 作 为 一 个 仓库 特定 的 字符 串 。 昌 然 策略 可 以 适用 于 从 对 象 中 删 
除 ， 它 们 被 视 为 不 透明 的 物体 规范 ， 策 略 应 用 到 的 对 象 ， 称 为 可 控 的 对 象 。 策 略 
应 用 到 对 象 的 效果 如 何 ， 完 全 是 仓库 特定 的 。 
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通过 CMIS， 可 以 创建 、 更 新 和 删除 策略 。 一 个 仓库 可 以 创建 这 种 基 类 的 子 
类 ， 以 更 具体 的 支持 各 种 不 同 的 行 策略 ; 如 果 一 个 仓库 不 支持 策略 对 象 ， 那 么 一 
个 “获取 类 型 ”的 服务 调用 ， 不 应 该 返回 该 策略 的 基础 对 象 类 型 。 对 于 一 个 
CMIS 1. 0 版 本 不 直接 支持 的 功能 ， 可 以 扩展 内 容 仓库 ， 来 公开 其 他 功能 。 


4.3.8 访问 控制 


一 个 仓库 可 以 支持 CMIS 定义 的 权限 集 ， 以 及 一 套 库 特 定 的 权限 设置 集 。 

getACL 服务 允许 请 求 者 指定 使 用 唯一 的 CMIS 定义 的 权限 表示 结果 。 如 果 没 
有 这 种 限制 ， 响 应 可 能 包括 ， 或 只 表示 在 特定 的 权限 库 ; applyACL 服务 允许 使 
用 CMIS 权限 或 仓库 权限 ， 或 是 两 者 的 结合 。 


4.3.9 版 本 化 


CMIS 支持 文档 对 象 的 版 本 化 ,文件 夹 对 象 、 关 系 对 象 和 策略 对 象 不 能 进行 
版 本 化 。 

一 个 文档 对 象 是 否 可 版 本 化 ， 即 是 否 可 以 通过 版 本 控制 服务 对 象 来 执行 的 操 
作 ， 通 过 它 的 对 象 类 型 上 的 “versionable” 属性 指定 。 

文档 对 象 的 一 个 版 本 是 一 个 有 明确 的 “深度 ”的 对 象 副 本 ， 在 某 一 时 间 点 
的 保存 状态 。 一 个 文档 对 象 的 每 个 版 本 ， 本 吴 就 是 一 个 文档 对 象 ， 即 有 其 自己 的 
对 象 ID ， 属 性 值 ， 可 能 在 文档 对 象 上 调用 的 所 有 CMIS 服务 等 。 


4.3. 10 查询 


CMIS 提供 了 一 个 基于 类 型 的 查询 服务 ， 通 过 定义 一 个 CMIS 数据 模型 到 一 
个 关系 视图 的 只 读 投影 ， 来 发 现 符合 指定 条 件 的 对 象 。 

通过 这 个 关系 视图 ,查询 可 以 用 一 个 简单 的 SQL SELECT 语句 执行 。 这 种 查 
询 语言 基于 SQL-92 语法 (1SO/IEC 9075: 1992 一 一 数据 库 语言 SQL) 的 子 集 ， 
做 了 一 些 扩展 ， 提 高 其 CMIS 数据 模型 的 过 滤 能 力 ， 比 如 多 值 属性 的 存在 量化 ， 
全 文 检索 和 文件 夹 对 象 。 不 通过 CMIS 的 其 他 报表 的 SQL 语言 。 

如 图 4-1 所 示 ，CMIS 的 查询 语言 的 语义 由 SQL-92 标准 定义 ， 加 上 扩展 ， 结 
合 通过 CMIS 的 关系 视图 定义 的 模型 映射 。 
4.3.11 更 改 日 志 

CMIS 提供 一 种 “更 改 日志 ” 的 机 制 ， 允 许 应 用 程序 很 容易 地 发 现 仓库 中 的 
存储 对 象 从 之 前 一 个 时 间 点 以 来 的 变化 ， 然 后 可 以 使 用 的 应 用 ， 如 搜索 服务 ， 最 


后 应 用 程序 可 以 使 用 这 种 变化 日 志 。 例 如 搜索 服务 ， 它 维护 一 个 仓库 的 外 部 索 
引 ， 来 有 效 地 确定 如 何 同步 索引 到 资料 库 的 当前 状态 ， 而 不 是 不 得 不 查询 当前 库 
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CMIS 查 询 

语法 语义 

SQL- 92 子 集 + 扩 展 SQL- 92+ 扩 展 
。 多 值 属 性 + 关系 视图 映射 
。 全 文 搜索 
.文件 夹 成 员 








关系 视图 















(对 象 类 型 ,类 型 继承 ) 
行 (对 象 ) 
(属性 ) 





数据 模型 | 
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图 4-1 CMIS 的 查询 语言 的 语义 关系 视图 定义 模型 
中 的 所 有 对 象 。 


4.4 服务 


CMIS 规范 的 服务 部 分 ， 定 义 了 一 套 以 协议 / 绑 定 的 方式 描述 的 服务 。 一 个 
CMIS 服务 器 公开 的 操作 ， 通 过 它 支 持 的 网 络 协议 ， 被 绑 定 在 一 系列 服务 中 ， 每 
一 个 CMIS 规范 的 协议 绑 定 ， 必 须 实 现在 本 节 中 所 述 的 所 有 方法 ， 或 解释 为 什么 
没有 实现 服务 。 关 于 每 个 服务 或 方法 是 如 何 实现 的 细节 ， 将 在 这 些 协议 绑 定 的 规 
范 中 描述 。 


4.4.1 通用 服务 元 素 


以 下 是 很 多 CMIS 服务 共同 通用 的 元 素 。 
4.4.1.1 分 页 


所 有 能 允许 检索 CMIS 对 象 集合 的 方法 ， 都 支持 按照 结果 集 进 行 分 页 ， 除 了 
明确 规定 其 他 的 除外 。 下 面 的 模式 被 用 作 : 

如 果 一 个 方法 的 调用 者 没有 为 maxItems 指定 一 个 值 ， 那 么 内 容 库 将 会 选择 
一 个 适当 的 项 目 号 码 作为 返回 结果 ， 如 果 有 任何 额外 的 结果 没有 返回 ， 那 么 必须 
用 hasMoreItems 作为 输出 参数 来 说 明 。 

内 容 库 会 返回 一 个 比 指定 maxltems 值 小 的 项 目 数 值 。 每 个 链接 将 会 按 上 下 
文 绑 定 不 同 的 hasMoreltmes 和 numltems。 
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4.4.1.2 在 CMIS 服务 调用 中 ， 检 索 对 象 上 的 额外 信息 

一 些 CMIS 服务 返回 对 象 的 信息 能 作为 其 自身 的 对 象 信息 的 一 部 分 ， 就 像 是 
操作 对 象 ， 交 互信 息 等 。 

CMIS 的 服务 可 以 支持 返回 结果 集 的 对 象 ， 包 括 能 够 返回 以 下 对 象 的 信息 : 

1) 属性 〈 检 索 一 个 子 集 ， 来 代替 额外 的 信息 ) 。 

2) 关系 。 

3) 翻译 。 

4) 访问 控制 列表 (ACL)。 

5) 允许 的 行为 。 

后 面 会 介绍 这 些 服务 的 输入 参数 和 输出 模式 ， 所 有 的 输入 参数 是 可 选 的 。 
4.4.1.3 更 改 令 牌 

CMIS 基础 对 象 类 型 定义 包括 一 个 不 透明 的 字符 串 “ChangeToken”， 内 容 库 
可 使 用 它 来 锁定 或 检 出 ， 以 确保 用 户 更 新 不 发 生 冲 突 。 

如 果 一 个 内 容 库 为 一 个 对 象 的 ChangeToken 属性 提供 一 个 值 ， 那 么 所 有 在 该 
对 象 的 更 新 方法 (比如 updateProperties ，setContentStream ，deleteContentStream ) 
的 调用 都 必须 提供 changeToken 属性 值 作为 一 个 输入 参数 ; 如 果 为 changeToken 

间 定 的 值 不 匹配 对 象 更 新 所 需 的 changeToken 值 ， 内 容 库 必 须 抛 出 一 个 update- 
ConflictException 异常 。 
4.4.1.4 例外 

在 规范 中 ， 列 出 了 一 套 完整 的 例外 集合 ， 基 于 一 个 CMIS 服务 方法 调用 ， 响 
应 由 一 个 仓库 返回 。 
4.4.1.5 访问 控制 列表 (ACL) 
通过 设置 访问 控制 列表 ， 来 表示 人 允许 这 些 服务 在 对 象 上 可 用 ， 可 以 使 用 可 选 
的 CMIS 宏 : 用 户 人 允许 调用 者 指示 操作 适用 于 当前 的 号 份 验证 的 用 户 。 


4.4.2 仓库 服务 


仓库 服务 被 用 来 发 现 仓库 的 信息 ， 包 括 为 它 定 义 的 对 象 类 型 的 信息 ， 服 务 包 
括 getRepositories ， getRepositoryInfo ，getTypeChildren ， getTypeDescendants ， getTy- 

















peDefinition。 
4.4.3 导航 服务 


导航 服务 用 于 遍历 在 CMIS 仓库 中 的 文件 夹层 次 结构 ， 定 位 检查 出 的 文件 ， 
服务 包括 getDescendants， getChildren， getFolderParent ， getObjectParents ， get- 
CheckedoutDocs。 
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4.4.4 对 象 服务 


对 象 服务 提供 方法 ， 用 于 创建 、 更 新 和 删除 对 象 ， 读 取 和 更 新 它们 的 属性 和 
内 容 ， 以 及 更 多 的 方法 ， 服 务 包括 createDocument，createFolder，createRelation- 
ship ，getProperties ，getContentStream ，updateProperties ，setContentStream 等 。 


4.4.5 多 存档 服务 


多 存档 服务 ， 包 括 addObjectToFolder 和 removeObjectFromFolder， 此 服务 用 于 
添加 文件 到 文件 夹 以 及 从 文件 夹 移 除 文件 ， 仅 当 仓库 支持 多 存档 功能 时 ， 它 们 才 
可 用 。 


4.4.6 发 现 服务 
发 现 服务 用 于 搜索 仓库 内 的 对 象 ， 包 括 query。 
4.4.7 版 本 服务 
版 本 服务 用 于 浏览 或 更 新 文件 版 本 ,服务 包括 checkOut ，cancelCheckOnut， 


getPropertiesOfLatestVersion, getAllVersions, deleteAllVersions。 


4.4.8 关系 服务 
关系 服务 用 于 检索 与 对 象 相 关联 的 对 象 的 依赖 关系 ， 包 括 getObjectRelation- 


ships。 


4.4.9 策略 服务 


策略 服务 用 于 可 控 对 象 的 应 用 或 删除 策略 对 象 ， 服 务 包括 applyPolicy ，re- 
movePolicy, getAppliedPolicies。 








4.4.10 ”ACL 服务 
访问 控制 列表 (ACL) 服务 ， 用 来 获取 当前 应 用 到 一 个 文件 或 文件 夹 对 象 的 
ACL， 或 应 用 一 个 新 的 ACL 到 对 象 ， 服 务 包括 getACL，applyACL。 


4.5 能 


正如 前 面 提 到 的 ， 一 个 CMIS 的 仓库 没有 义务 实现 标准 描述 的 所 有 可 能 的 功 
能 ， 所 以 ， 其 中 一 些 被 定义 为 可 选 的 规范 。 在 任何 情况 下 ， 希望 针对 一 个 特定 的 
服务 器 实现 工作 的 客户 ， 必 须 有 办 法 知道 哪些 功能 是 支持 的 ， 哪 些 是 不 支持 的 。 





第 4 音 内容 管理 互 操作 性 服务 83. 





为 了 让 客户 发 现 一 个 给 定 的 服务 支持 哪些 功能 ,该 标准 定义 了 一 种 方法 ， 用 
于 让 服务 器 来 描述 自己 的 能 力 。 能 力 被 命名 为 属性 ， 该 属性 可 以 为 一 个 布尔 值 ， 
如 果 服 务 器 有 能 力 ， 为 tue; 如 果 没 有 能 力 ， 为 false; 属性 也 可 以 是 一 个 可 能 
的 列表 之 一 。 下 面 根据 有 关 服 务 分 组 ， 列 出 了 CMIS 定义 的 所 有 可 选 能 











4.5.1 导航 能 力 ( 见 表 4-1) 
表 4-1 导航 能 
能 力 描述 可 能 的 值 
getDescendants 枚 举 一 个 文件 夹 后 代 的 能 a 
false 
getFolderTree 检索 文件 夹 树 的 能 tue 
false 








4. 5.2 ”对 象 能 力 ( 见 表 4-2) 


表 4-2 ”对象 能 
能 力 描述 


| 


能 的 值 





未 仓库 有 个 硬 妆 none: 内 容 流 可 能 永远 不 被 更 新 
0 和 新 | ytime; 可 随时 更 新 的 内 容 流 
吃 pwconly : 只 有 当 检 出 时 , 才 可 被 更 新 的 内 容 流 





contentStreamUpdatability 





none: 仓库 不 支持 更 改 日 志 功 能 
A objectidsonly: 更 改 日 志 只 返回 对 象 ID 和 更 改 






































四 公开 资源 库 , 通过 “更 全 2 
ob 和 properies; 更 改 日 志 能 返回 更 改 对 象 的 属性 








和 ID 
all: 返回 更 改 对 象 的 ID 和 更 多 信息 








指示 是 否 把 文档 对 象 | ”none: 仓库 根本 不 暴露 描述 
库 公 开 read; 仓库 提供 描述 ,客户 端 是 只 读 





renditions 














4. 5.3 存档 能 力 ( 见 表 4-3) 
表 4-3 存档 能 






























































能 力 描 述 可 能 的 值 
1HiFili 一 个 应 用 可 以 存档 一 个 文件 或 其 他 一 些 fle-able true 
ee 对 象 在 多 个 文件 夹 的 能 false 
Fili 一 个 应 用 可 以 离开 一 个 文件 或 其 他 一 些 file-able true 
对 象 不 在 任何 文件 夹 的 能 false 
; i 一 个 应 用 可 以 存档 一 个 文件 的 独立 版 本 (不 是 所 true 
versionSpecificFiling 有 版 本 ) 在 一 个 文件 夹 的 能 false 
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4. 5.4 版 本 化 能 力 ( 见 表 4-4) 
表 4-4 版 本 化 能 























能 力 描述 可 能 的 值 
新 一 个 检 出 文档 的 “Private Worki 
PWC Updatable 更 新 个 检 出 文档 的 “ Private Working Copy” 属 tue 
性 的 能 | 
一 个 仓库 能 包括 “ Private Working Copy” 的 检 出 ti 
PWC Searchable | 文件 查询 搜索 范围 的 能 oe 
allVersionsSearchable 一 个 仓库 能 包括 所 有 文档 版 本 的 查询 搜索 范 true 
“sionsSearchable | 围 的 能 力 ;否则 ,只 有 最 新 版 本 的 文件 可 以 搜索 alse 











4. 5.5 查询 能 力 ( 见 表 4-5) 
表 4-5 查询 能 
能 力 描 述 可 能 的 值 





none 


metadataonly 





query 表明 该 类 型 的 查询 , 库 是 否 有 能 力 完成 
fulltextonly bothseparate 


bothcombined 





none 
join 表明 JOIN 关键 字 的 类 型 , 库 是 否 可 以 查询 inneronly 


innerandouter 








4.5.6 ACL 能 力 ( 见 表 4-6) 


表 4-6 ACL 能 











能 力 描述 可 能 的 值 
和 康吉 持 所 none: 仓库 不 支持 ACL 服务 

ACL 仓库 支持 的 ACT discover: 仓库 支持 ACL 的 发 现 

0 manage : 仓库 支持 ACL 的 发 现 和 应 用 ACL 











4. 5.7 可 选 能 力 


商业 的 ECM 内 容 仓库 产品 在 设计 上 会 有 所 不 同 ， 有 些 库 是 专 为 特定 的 应 用 
领域 设计 ， 可 能 无 法 提供 不 为 它们 的 目标 域 中 所 需 的 某 些 功能 。 因 此 ， 一 个 仓库 
实现 可 能 不 一 定 能 够 支持 所 有 的 CMIS 能 力 。 所 以 ， 一 些 CMIS 的 能 力 对 于 一 个 
仓库 是 符合 “可 选 ”， 可 以 使 用 getRepositoryInfo 服务 ， 来 发 现 一 个 仓库 的 这 些 可 
选 功 能 支持 。 
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4. 5.8 一 个 示例 


下 面 是 Alfresco 社区 版 本 4. 0. d 支持 的 功能 列表 。 这 个 功能 列表 可 以 通过 检 
查 AtomPub 服务 文档 得 到 ， 在 本 机 安装 后 ， 一 般 在 以 下 地 址 : http: //localhost: 
8080/alfresco/ service/ api/ cmis。 
表 4-7 列 出 了 Alfresco 所 支持 的 能 
表 4-7 Alfresco 的 能 力 列表 























能 可 能 的 值 能 可 能 的 值 
ACL manage PWC-Searchable true 
allVersionsSearcheable false PWC- Updatable true 

changes objectidsonly query bothcombined 

contentStreamUpdatability anytime renditions read 
getDescendants true unFiling false 
getFolderTree true versionSpecificFiling false 
multiFiling true join none 














4.6 协议 绑 定 


选择 传统 的 基于 SOAP 的 Web 服务 ， 还 是 选择 REST 风格 ,完全 取决 于 开发 
者 的 喜好 ; 对 此 ，CMIS 的 技术 委员 会 决定 不 偏 祖 和 站 在 任何 一 方 ， 授 权 服 务 带 
执行 支持 两 种 客户 。 他 们 通过 把 CMIS 的 语义 定义 为 一 组 协议 无 关 的 服务 ， 这 些 
服务 可 以 使 用 这 两 个 协议 的 绑 定 之 一 来 暴露 ，RESTful Atom 绑 定 和 Web Services 
绑 定 。 

首先 介绍 基于 Atom 发 布 协议 的 绑 定 ， 连 同 CMIS 的 特定 的 扩展 ， 然 后 介绍 
使 用 SOAP。 














4.6.1 REST 风格 的 AtomPub 绑 定 


AtomPub ( Atom 发 布 协议 ) 和 SOAPZWSDL 两 者 都 具有 提供 编写 服务 以 供 他 
人 使 用 的 能 力 ， 但 AtomPub 采取 了 一 种 完全 不 同 的 途径 来 帮助 用 户 实现 他 们 的 
服务 。 它 实现 了 一 些 能 令 用 户 更 自由 的 约束 。 因 为 数据 受 限 于 统一 格式 一 一 每 个 
条 日 都 包括 tile、entry、id 和 content/summary， 这 使 得 我 们 能 从 一 条 Atom feed 
中 得 到 有 用 的 信息 ， 而 不 管 这 条 feed 来 自 哪 一 类 型 的 应 用 。 对 我 们 来 说 ， 解 析 
日 历数 据 就 像 解 析 一 个 雇员 目录 或 者 是 阅读 网 络 日 志 一 样 的 简单 。 不 需要 任何 特 
殊 的 工具 或 者 更 多 的 信息 ， 仅 仅 只 需 了 解 这 是 基于 AtomPub 的 服务 。 但 从 另 一 
方面 ， 这 种 约束 也 限制 了 AtomPub 的 适用 性 一 一 它 绝 不 是 一 个 万 能 的 协议 ,很 
多 信息 用 AtomPub 来 建 模 会 显得 过 于 笨拙 。 事 实 上 ， 当 数据 是 有 时 序 的 列表 时 ， 
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AtomPub 是 其 自然 的 选择 。 
AtomPub 协议 的 相关 介绍 ， 可 以 访问 下 面 网 址 : http : //atompub. org/。 
任何 以 AtomPub 为 基础 的 服务 ， 都 需要 有 一 个 独立 的 URL， 客 户 端 用 于 开 

始 使 用 该 服务 。 所 有 其 他 的 网 址 ， 可 以 从 服务 文件 继承 过 来 ， 它 可 在 这 个 URL 

今 索 。 服 务 文档 包含 集合 的 引用 ， 集 合 代表 仓库 不 同 部 分 的 视图 ， 比 如 文件 和 文 

件 来， 类型， 关系 和 权限 。 
集合 通过 Atom 种 子 表 现 ， 客 户 可 以 检索 ， 例 如 ， 列 出 一 个 文件 夹 中 的 文 

件 。 客 户 应 post Atom 入 口 文件 到 一 个 集合 的 URL， 来 创建 新 入 口 ， 比 如 一 个 文 

件 夹 中 的 新 文件 。 

Atom Publishing Protocol (APP) 是 基于 HTTP 的 ， 被 用 于 出 版 物 和 张贴 网 上 
资源 。APP 连同 Atom Syndication Format (ASF ) 一 起 提供 互动 内 容 3 特别 是 在 博 
客 和 RSS。Atom 已 成 为 一 个 Web2.0 风格 的 解决 方案 的 流行 元 素 。APP/ASF 表 
示 一 个 数据 模型 ， 它 比 WebDAV 模型 要 简单 ， 由 元 素 和 元 素 选 择 组 成 ， 但 不 包 
括 选 择 的 地 点 ， 也 就 是 选择 的 层次 。 


4. 6.2 Web Services 绑 定 


在 域 模 型 中 定义 的 所 有 服务 和 操作 ， 都 通过 Web 服务 绑 定 表现 。 通 过 Web 
服务 绑 定 暴露 的 服务 ， 很 自然 地 使 用 Web 服务 定义 语言 (WSDL) 文档 和 相关 
的 XML 模式 文档 来 描述 。 有 两 种 模式 文件 : 第 一 个 为 文件 、 文 件 夹 、 关 系 和 策 
略 ， 以 及 这 些 对 象 类 型 的 集合 的 主 数据 类 型 定义 元 素 。 第 二 个 模式 文件 为 每 一 个 
CMIS 服务 定义 消息 格式 。 

WSDL 文档 主要 描述 服务 和 操作 之 间 的 一 对 一 映射 ， 此 部 分 在 规范 的 第 一 部 
分 中 已 介绍 ， 并 已 总 结 为 SOAP 方法 。 

这 些 服 务 的 WSDL 参考 两 个 XSD 文件 。 一 个 定义 主 数据 类 型 的 文件 、 文 件 
来、 关系 和 策略 ， 以 及 这 些 类 型 的 对 象 集合 的 元 素 。 第 二 个 XSD 定义 的 CMIS 服 
务 的 消息 格式 ， 消 息 通 常 是 指 第 一 个 XSD 架构 中 定义 的 数据 类 型 。WSDL 的 介 
绍 是 在 “服务 ”一 节 中 定义 的 抽象 服务 。 

规范 的 CMIS Web 服务 绑 定 ， 由 WSDL 和 XSD 定义 ， 以 及 在 这 个 例子 以 外 
的 一 些 CMIS 规范 和 一 些 细节 。 


4.7 一 致 性 
































4.7.1 规格 


CMIS 规范 参考 了 其 他 一 些 规范 。 为 了 遵守 这 一 规范 ， 一 个 实现 必须 执行 部 
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分 引用 的 规范 ,来 遵守 本 规范 规定 的 要 求 。 此 外 ， 参 考 规范 的 部 分 实现 ， 在 本 规 
范 中 特别 提 到 必须 遵守 规则 的 部 分 ， 也 需要 在 参考 规范 中 建立 。 

一 个 实现 ， 如 果 它 满足 在 CMIS 规范 中 定义 的 所 有 MUST 或 REQUIRED 级 别 
的 要 求 ， 那 么 它 是 符合 本 规范 的 。 


4.7.2 域 模型 


在 本 规范 中 的 规范 文本 ， 优 先 于 CMIS 核心 XML 模式 。 也 就 是 说 ， 在 这 个 
规范 中 的 规范 文本 ， 进 一 步 限 制 了 作为 本 规范 一 部 分 的 模式 和 /或 WSDL; 此 规 
范 包含 进一步 的 限制 ， 针 对 在 参考 模式 中 定义 的 元 素 。 

1) 客户 端 实现 “MAY” 实现 或 者 是 RESTful AtomPub 绑 定 ， 或 者 是 Web 服 
务 绑 定 。 

2) 内 容 库 “MUST” 实现 以 下 CMIS 协议 绑 定 : 

QD RESTful AtomPub 绑 定 。 

@) Web 服务 绑 定 。 


4.7.3 REST 绑 定 


CMIS 规范 参考 了 一 些 其 他 规范 。 为 了 遵守 这 些 参考 规范 ，CMIS 的 实现 必须 
遵守 部 分 引用 的 规范 所 规定 的 要 求 。 此 外 ， 执 行 部 分 的 参考 规范 ， 特 别提 到 在 本 
规范 中 必须 遵守 规则 的 部 分 建立 在 参考 规范 。 

另外， 在 本 规范 中 的 规范 文本 优先 于 CMIS RESTAtom XML 模式 。 也 就 是 
说 ， 在 本 规范 中 的 规范 文本 进一步 制约 模式 和 作为 本 规范 一 部 分 的 WSDL; 同时 
还 制约 本 规范 中 包含 的 进一步 的 限制 元 素 定 义 的 参考 架构 。 

CMIS RESTAtom XML 可 优先 于 任何 例子 或 非 规 范 性 的 概述 ， 包 括 在 本 文件 
或 独立 的 例子 。 

4.7.4 Web 服务 绑 定 

在 本 规范 中 的 规范 文本 优先 于 CMIS 的 消息 XML 和 CMIS 的 WSDL。 也 就 是 
说 ， 在 本 规范 中 的 规范 文本 ， 进 一 步 制 约 模式 和 作为 本 规范 的 一 部 分 的 WSDL; 
本 规范 包含 在 参考 模式 中 定义 的 元 素 的 进一步 限制 。 

CMIS 的 消息 XML 和 CMIS 的 WSDL 优先 于 任何 例子 或 非 规范 性 的 概述 ， 包 
括 在 本 文件 或 独立 的 例子 。 


4.8 行动 中 的 CMIS 





CMIS 是 一 个 相对 较 新 的 规范 ，2010 年 10 月 CMIS1.0 刚刚 定稿 。 但 是 我 们 
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已 经 看 到 ， 无 论 是 在 服务 器 产品 ， 还 是 在 各 种 语言 的 客户 端 工具 包 ，CMIS 都 被 
广泛 采用 。 
4.8.1 支持 CMIS 的 产品 


目前 ， 一 些 内 容 管理 产品 已 经 宣布 支持 CMIS, 包括 Alfresco，Drupal， 
Nuxeo，eXo，KnowledgeTree， 以 及 Sense/ Net。 

1. Alfresco 

Alfresco 公司 一 直 走 在 CMIS 的 前 列 ， 是 CMIS 最 突出 的 支持 者 之 一 ， 早 在 
2008 年 10 月 ， 距 离 CMIS 的 最 初 公 布 不 到 一 个 月 后 ， 在 其 版 本 3.0 Labs 中 , 已 
经 开始 发 布 一 个 符合 草案 规范 的 版 本 实现 。 

当前 的 Alfresco3.3 社区 版 本 ，Alfresco 声称 提供 的 CMIS 服务 是 符合 
CMIS1. 0 规范 的 。 当 然 ， 他 们 的 实现 是 完全 开源 的 ， 这 意味 着 如 果 因 为 bugs 或 
遗漏 ， 事 实证 明 不 完全 符合 的 ， 开 发 者 可 以 自由 修复 它 。 

Alfresco 支持 两 种 CMIS 的 协议 绑 定 ， 一 种 是 AtomPub 绑 定 ， 一 种 是 作为 
Web 服务 绑 定 。 前 者 的 实现 是 基于 一 套 Web Scripts ， 使 用 Apache Abdera 库 ， 利 
用 一 些 CMIS 特定 扩展 名 来 解析 和 生成 Atom 文档 ， 并 利用 一 个 Java API 层 。 而 
后 者 则 使 用 Apache CXF 的 工具 包 ， 也 生成 同样 的 Java API， 可 以 通过 SOAP 消 


息 来 使 用 。 图 4-2 说 明了 两 个 实现 的 基础 。 


Web 脚本 


Apache Abdora 


Apache CXF 
CMIS 
扩展 


图 4-2 Alfresco 支持 的 两 种 CMIS 的 协议 绑 定 


安装 Alfresco 后 ， 查 阅 AtomPub 绑 定 的 服务 文件 可 以 访问 : http: //local- 
host: 8080/alfresco/service/api/ cmis。 
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查阅 关于 Web 服务 绑 定 的 WSDL 可 以 访问 : http: //localhost: 8080/alfres- 
co/ cmiso 

关于 Alfresco 的 CMIS 实现 的 一 个 特点 是 ， 它 支持 Alfresco 全 文 检索 语言 ， 内 
置 包含 CMIS-SQL 查询 的 谓词 。 所 以 ， 它 允许 使 用 者 运行 如 下 的 查询 ， 此 查询 搜 
索 所 有 FreeMarker 模板 (扩展 FTL)， 并 在 其 文本 中 包含 短语 “Alfresco”。 

SELECT * FROM cmis: document WHERE CONTAINS ('TEXT. alfresco AND 
cm_ name: +*{l') 

在 Alfresco 的 实现 中 ， 也 提供 了 有 限 方面 的 支持 。 可 以 通过 对 象 表 加 入 Ob- 
jectID 字段 ， 来 查询 ， 如 下 所 示 : 


select d. * , 0. * from cmis: document as d join cm: ownable as o on d. cmis: 




















objectid = o. cmis: objectid 

这 些 实现 细则 中 ， 有 些 肯定 会 在 未 来 的 Alfresco 版 本 中 改变 ， 你 可 以 密切 关 
注 页 面 : http: //wiki. alfresco. com/ wiki/ CMIS。 

Alfresco 公司 也 在 其 产品 的 企业 版 本 中 包括 CMIS 的 支持 ,但 企业 版 本 中 的 
新 功能 发 布 ， 往 往 会 比 社 区 版 本 加 以 更 多 的 照顾 和 监督 。 此 外 , 在 Alfresco 企业 
版 本 中 的 CMIS 实现 ， 不 包括 在 官方 的 支持 协议 。 基 于 以 上 ， 如 果 你 想 参 与 
CMIS 的 测试 ， 可 行 的 方式 是 使 用 社区 版 本 或 基于 cmis. alfresco. com 主持 的 一 个 
更 好 的 服务 。 

2. 主机 托管 的 CMIS AtomPub 测试 兼容 工具 集 

Alfresco 公司 还 提供 了 在 http: //emis. alfresco. com 可 公开 访问 的 测试 服务 
器 ， 开 发 者 可 以 用 它 来 测试 自 有 客户 端 代码 的 一 致 性 。 使 用 用 户 名 admin 、 密 码 
admin 作为 此 服务 器 的 凭据 ， 可 以 随意 创建 新 的 内 容 。 

在 同一 服务 器 上 ， 托 管 了 Alfresco 的 可 公开 访问 的 CMIS 服务 器 ， 其 包括 一 
个 CMIS 的 测试 兼容 性 工具 包 (TCK) 的 AtomPub 绑 定 。 

如 果 访 问 http: //emis. alfresco. com， 会 找到 一 种 形式 ， 在 那里 开发 者 可 以 
输入 CMIS 服务 器 的 URL， 并 有 一 整套 针对 执行 兼容 性 测试 。 您 需要 提供 Atom- 
Pub 服务 文件 的 URL， 因 为 截至 目前 提供 的 TCK，, 没有 Web 服务 绑 定 。 

3. Nuxeo 

Nuxeo 是 一 种 流行 的 ， 开 源 的 企业 内 容 管理 产品 。2010 年 2 月 4 日 ，Nuxeo 
宣布 其 数字 资产 管理 (DAM) 应 用 的 1. 0 版 本 支持 CMIS 规范 。 

更 多 NuxeoDAM 的 有 关 信 息 可 以 访问 http: //nuxeo. com/en/products/dam。 

4. eXo 

eXo 平台 是 一 个 开源 的 产品 套件 ， 提 供 服 务 ， 比 如 企业 内 容 管理 、Web 内 容 
管理 、 协 作 、 门 户 、 知 识 管理 等 。 

2010 年 2 月 11 日，eXo 宣布 退出 一 个 可 用 性 的 xCMIS, 一 个 CMIS 1. 0 委员 
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会 草案 06 的 Java 实现 ,利用 eXo 的 JCR 内 容 库 。 

xCMIS 宣称 同时 支持 AtomPub 和 Web 服务 绑 定 。 

S， KnowledgeTree 

KnowledgeTree 是 一 个 基于 PHP 的 开源 文档 管理 软件 ， 目 前 可 用 的 有 一 个 
GPL (通用 公共 许可 证 ) 许可 的 社区 版 和 一 个 功能 更 丰富 的 商业 版 。 

在 写作 本 书 的 时 候 ， 有 一 个 KnowledgeTree 支持 的 CMIS 服务 需 端 实现 可 用 ， 
具体 网 址 为 http : /A/wiki. knowledgetree. com/CMIS 。 它 宣称 支持 CMIS 草案 0. 61ec 
的 AtomPub 绑 定 。 

6. Sense/Net 

Sense/ Net 是 一 个 基于 . NET 的 开源 平台 ， 专 门 针 对 开发 企业 内 容 管理 和 门 
户 解决 方案 。 

Sense/ Net 6. 0， 目 前 只 有 测试 版 的 形式 提供 ， 既 是 一 个 CMIS 的 服务 器 ， 也 
是 一 个 客户 端 ， 能 够 从 其 他 CMIS 的 提供 商 提取 内 容 。 

更 多 关于 Sense/Net 文 持 CMIS 的 信息 可 以 从 网 站 www. sensenet com 中 查阅 。 


4. 8. 2 支持 CMIS 的 闭 源 产 品 


1. IBM 

IBM 发 布 了 一 个 “技术 预览 "， 为 IBM FileNet 和 IBM 内 容 管理 产品 提供 了 
一 个 CMIS 的 AtomPub 绑 定 。 可 以 在 下 面 网 址 找到 更 多 的 信息 : http: // 
www. ibm. com/ developerworks/ data/ downloads/ cmistechpreview/ 。 

2. EMC 

EMC 公司 是 一 个 历史 悠久 的 专业 公司 ， 专 注 于 所 有 形式 的 内 容 存 储 和 管理 ， 
是 CMIS 委员 会 的 创始 成 员 之 一 ， 他 们 最 近 收 购 的 Documentum 是 世界 上 最 突出 
的 ECM 厂商 之 一 。 

EMC 给 注册 用 户 发 布 了 一 个 CMIS 的 早期 访问 产品 ， 目 前 是 第 3 版 。 没 有 注 
册 的 ECM 的 用 户 ， 还 不 能 够 找到 更 多 关于 它 的 细节 。 更 多 信息 提供 在 下 面 网 址 : 
https: //community. emc. com/community/labs/cmis 。 

3. 微软 

微软 在 它 新 近 推出 的 SharePoint Server 2010 产品 中 ,正式 宣布 增加 对 CMIS 
的 支持 , 微软 SharePoint Server 2010 内 置 一 个 内 容 管 理 互 操作 性 服务 (CMIS) 连 
接 右 ，SharePoint 用 户 可 利用 它 与 存储 在 任何 已 实施 CMIS 标准 的 存储 库 中 的 内 
容 交 互 。 此 连接 需 还 使 SharePoint Server 2010 内 容 可 供 任 何 已 实施 CMIS 标准 的 
应 用 程序 使 用 。CMIS 连接 器 作为 SharePoint 2010 Administration Toolkit 的 一 部 分 
提供 ， 有 关 更 多 详细 信息 ， 请 参阅 下 面 网 址 : http: //technet. microsoft. com/zh- 
cn/library/ ce508851. aspx。 
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4. Day Software 
2010 年 4 月 ，Day Software 公司 宣布 他 们 的 CRX 平台 2. 1 版 本 已 经 可 用 ,并 
支持 CMIS 的 1.0 规范 。 





4. 8.3 客户 端 工具 


至 今 为 止 ， 只 有 少数 的 开源 CMIS 的 客户 端 工 具 包 ， 但 能 看 出 在 开发 者 和 开 
发 商 之 间 ， 它 们 已 经 组 织 了 一 些 数量 可 观 的 活动 。 这 些 厂 商 包 括 Apache Chemis- 
try、OpenCMIS 和 Drupal (PHP 的 CMIS 客户 端 API) 。 

1. Apache Chemistry 和 OpenCMIS 

OpenCMIS 和 Apache Chemistry 最 近 宣布 ， 这 两 个 项 目 已 正式 融合 ，OpenC- 
MIS 的 代码 捐赠 给 Chemistry 合并 。 因 此 ， 如 果 你 想 使 用 Java 开发 CMIS 客户 端 ， 
应 更 关注 后 者 。 

2. Drupal 

Drupal 有 一 个 可 选 的 CMIS 模块 ， 具体 功能 在 http: //drupal. org/project/ 
cmis 中 描述 , “主要 是 提供 一 个 API， 用 于 连接 到 CMIS 兼容 的 系统 、 双 向 同步 
之 间 的 CMIS ECM 系统 和 Drupal 的 内 容 。 除 了 API 外 ， 这 个 包 还 提供 了 一 系列 
基本 功能 ， 包 括 创建 、 更 新 、 浏 览 和 搜索 内 容 ， 通 过 Drupal 界面 ， 在 CMIS ECM 
系统 的 范围 内 。 模 块 的 总 体 目标 是 提供 一 个 易于 使 用 ,在 Drupal 中 的 WCM 前 
端 ， 访 问 web 内 容 管理 者 往往 不 熟悉 的 ECM 系统 。” 

毫 无 疑问 ， 开 源 供应 商 、 闭 源 供应 商 ， 都 会 致力 提供 开发 库 ， 让 开发 人 员 使 
用 CMIS 与 他 们 的 服务 器 产品 进行 互动 。 
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以 服务 为 导向 的 Web 应 用 目前 正方 兴 未 艾 。Web 服务 (Web Service) 是 一 
种 以 SOAP 为 轻 量 型 传输 协议 、 以 XML 为 数据 封装 标准 、 基 于 HTTP 的 组 件 集 成 
技术 。 使 用 SOAP 作为 组 件 间 的 调用 协议 ， 使 用 HTTP 页 面 作为 客户 端 与 服务 器 
之 间 的 数据 传输 方式 ， 使 XML 作为 数据 封包 的 标准 。 因 而 它 具 有 跨 平 台 调 用 和 
无 颖 集成 组 件 服务 的 卓越 性 能 。 

任何 组 件 模型 、 开 发 工具 、 程 序 语 言 和 应 用 系统 只 要 支持 XML 和 文本 格式 
的 数据 ， 就 可 以 顺利 地 使 用 该 技术 。 而 现在 所 有 组 件 模 型 、 开 发 工具 、 程 序 语 
言 、 应 用 系统 和 操作 系统 都 支持 XML 和 文本 格式 ， 当 然 就 可 以 完全 支持 SOAP 
了 。 作 为 Web 服务 技术 核心 的 SOAP 是 一 个 开放 的 标准 协议 。 它 不 仅 突 破 了 应 
用 壁垒 ， 而 且 能 够 结合 企业 防火 墙 和 内 部 信息 系统 ， 同 时 提供 安全 和 集成 的 应 用 
环境 ;允许 企业 封装 任何 自 定 义 信息 ， 而 不 需要 修改 应 用 系统 的 源 代码 ， 提 供 了 
强大 的 系统 弹性 。 

REST 的 全 称 是 Representational State Transfer， 即 表征 状态 转移 ， 是 Roy 
Fielding 博士 在 2000 年 他 的 博士 论文 中 提出 来 的 一 种 软件 架构 风格 。 目 前 在 三 种 
主流 的 Web 服务 实现 方案 中 ， 因 为 REST 模式 的 Web 服务 与 复杂 的 SOAP 和 
XML-RPC 对 比 来 讲 明显 地 更 加 简洁 ， 越 来 越 多 的 Web 服务 开始 采用 REST 风格 
设计 和 实现 。 













































































S.1 SOAP 


5.1.1 SOAP 的 介绍 


SOAP 的 全 称 是 Simple Object Access Protocol， 即 简单 对 象 访问 协议 ， 是 一 种 
标准 化 的 通信 规范 ， 主 要 用 于 Web 服务 (Web Service) 中 。SOAP 是 一 种 轻 量 
的 、 简 单 的 、 基 于 XML 的 协议 ，SOAP 采用 了 已 经 广泛 使 用 的 两 个 协议 : HTTP 
和 XML。HTTP 用 于 实现 SOAP 的 RPC (远程 过 程 调用 协议 ) 风格 的 传输 ， 而 
XML 是 它 的 编码 模式 。SOAP 把 成 熟 的 基于 HTTP 的 Web 技术 与 XML 的 灵活 性 
和 可 扩展 性 组 合 在 了 一 起 ， 它 被 设计 成 在 Web 上 交换 结构 化 的 和 固化 的 信息 。 
SOAP 技术 有 助 于 实现 大 量 异 构 程 序 和 平台 之 间 的 互 操 作 性 ， 从 而 使 存在 的 应 用 
能 够 被 广泛 的 用 户 所 访问 。 
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SOAP 的 出 现 是 为 了 简化 网 页 服务 器 (Web Server) 在 从 XML 数据 库 中 提取 
数据 时 ， 无 需 花 时 间 去 格式 化 页 面 ， 并 能 够 让 不 同 应 用 程序 之 间 通 过 HTTP 通信 
协定 ， 以 XML 格式 互相 交换 彼此 的 数据 ， 使 其 与 编程 语言 、 平 台 和 硬件 无 关 。 
此 标准 由 IBM、 微 软 、UserLand 和 DevelopMentor 在 1998 年 共同 提出 ， 并 得 到 
IBM、 莲 花 (Lotus) 、 康 柏 (Compaq) 等 公司 的 支持 ， 于 2000 年 提交 给 万 维 网 
联盟 (World Wide Web Consortium，W3C) ， 目 前 SOAP 1. 1 版 本 是 业界 共同 的 标 
准 ， 属 于 第 二 代 的 XML 协定 (第 一 代 主 要 代表 性 的 技术 为 XML-RPC 以 及 WD- 
DX )。 

SOAP 的 一 个 主要 目标 是 使 存在 的 应 用 能 被 更 广泛 的 用 户 所 使 用 ，SOAP 可 
以 与 现存 的 许多 互联 网 协议 和 格式 结合 使 用 ， 包 括 超 文本 传输 协议 ( HTTP)、 
简单 邮件 传输 协议 (SMTP)、 多 用 途 网 际 邮件 扩充 协议 (MIME)。 它 还 支持 从 
消息 系统 到 远程 过 程 调用 (RPC) 等 大 量 的 应 用 程序 。 

SOAP 是 一 种 轻 量 级 协议 ， 用 于 在 分 散 型 、 分 布 式 环境 中 交换 结构 化 信息 。 
SOAP 利用 XML 技术 定义 一 种 可 扩展 的 消息 处 理 框架 ， 它 提供 了 一 种 可 通过 多 
种 底层 协议 进行 交换 的 消息 结构 。 这 种 框架 的 设计 思想 是 要 独立 于 任何 一 种 特定 
的 编程 模型 和 其 他 特定 实现 的 语义 。 


5.1.2 SOAP 的 四 个 部 分 


SOAP 包括 四 个 部 分 : 

1) SOAP 封装 : 它 定义 了 一 个 框架 ,该 框架 描述 了 消息 中 的 内 容 是 什么 ， 
谁 应 当 处理 它 以 及 它 是 可 选 的 还 是 必须 的 。 

2) SOAP 编码 规则 : 它 定 义 了 一 种 序列 化 的 机 制 ， 用 于 交换 应 用 程序 所 定 
义 的 数据 类 型 的 实例 。 

3) SOAP RPC 表示 : 它 定义 了 用 于 表示 远程 过 程 调用 和 应 答 的 协定 。 

4) SOAP 绑 定 : 定义 了 一 种 使 用 底层 传输 协议 来 完成 在 节点 间 交 换 SOAP 封 
装 的 约定 。 

SOAP 消息 基本 上 是 从 发 送 端 到 接收 端的 单 向 传输 ， 但 它们 常常 结合 起 来 执 
行 类 似 于 请 求 / 应 答 的 模式 。 所 有 的 SOAP 消息 都 使 用 XML 编码 。 一 条 SOAP 消 
息 就 是 一 个 包含 有 一 个 必需 的 SOAP 的 封装 包 、 一 个 可 选 的 SOAP 标 头 和 一 个 必 
需 的 SOAP 体 块 的 XML 文档 。 

把 SOAP 绑 定 到 HTTP 提供 了 同时 利用 SOAP 的 样式 和 分 散 的 灵活 性 的 特点 
以 及 HTTP 丰富 的 特征 库 的 优点 。 在 HTTP 上 传送 SOAP 并 不 是 说 SOAP 会 覆盖 
现 有 的 HTTP 语义 ， 而 是 HTTP 上 的 SOAP 语义 会 自然 地 映射 到 HTTP 语义 。 在 
使 用 HTTP 作为 协议 绑 定 的 场合 中 ,，RPC 请 求 映射 到 HTTP 请 求 上 ， 而 RPC 应 
答 映 射 到 HTTP 应 答 。 然 而 ,在 RPC 上 使 用 SOAP 并 不 仅 限 于 HTTP 协议 绑 定 。 
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SOAP 定义 的 目的 是 让 不 同 的 应 用 程序 运行 在 分 布 式 环境 ， 分 散 、 交 换 结 构 
化 信息 。 关 于 规范 的 参考 标准 ， 可 以 访问 http : //www. w3. org/tr/soap/。 
s$.1.3 SOAP 消息 的 格式 

使 用 SOAP 的 应 用 程序 ， 通 过 在 一 个 通信 通道 中 交换 单 向 XML 信息 来 通信 。 
通常 ， 不 完全 使 用 HTTP 作为 传输 协议 。 一 个 SOAP 消息 ， 如 下 所 示 ， 包 含 一 个 
XML 文档 ， 它 的 根 元 素 是 Envelope (信封 ) : 


<? xml version =”1.0” encoding =”UTF-8”? > 





Mm 


<sodpenv: Envelope xmins: soapenv =" http://schemas.xmlsoap.org/ 
soap/envelope/” 

xmlns :xsd =" http://www. w3. org/20! /XMLSchema” 

xmlns :xsi =" http://www. w3. org/201/XMLSchema-instance” > 

<soapenv:Header > 

<1! --application specific information -- > 

</soapenv:Header > 

<soapenv:Body > 

<yourCustomserviceMethod xmlns ="” yourCustomServiceNamespace” > 

<parameters /> 

</yourCustomServiceMethod > 

</soapenv:Body > 

</soapenv:Envelope > 

Envelope 元 素 是 一 个 SOAP 消息 的 根 元 素 ， 它 必须 符合 下 列 XML 模式 : 
http: //schemas. xmlsoap. org/ soap/ envelope/ 。 

一 个 SOAP 的 Envelope 元 素 由 以 下 组 成 : 

1) 一 个 Header 头 元 素 (可 选 ) 。 

2) 一 个 Body 主体 元 素 (强制 性 ) 。 

标题 元 素 是 用 来 沟通 消息 而 不 是 传输 数据 ， 主 要 是 用 来 控制 消息 交换 。 例 
如 ， 一 个 标题 可 以 用 来 发 送 安全 或 交易 的 信息 。 主 体 元 素 的 内 容 可 以 是 任何 有 效 
的 XML 片段 ， 它 是 为 了 从 客户 端 到 服务 器 传达 特定 应 用 信息 的 。 

然而 SOAP 规范 并 没有 对 消息 的 主体 内 容 上 定义 任何 类 型 的 语义 约束 ， 因 为 
SOAP 的 初始 目的 是 为 了 实现 远程 过 程 调用 ( RPC) 机 制 。 在 这 种 情况 下 ， 大 多 
数 内 容 管理 系统 实现 的 Web 服务 包含 在 客户 端 请 求 的 XML 消息 ， 将 指定 远程 过 
程 的 名 称 和 传递 给 那些 过 程 的 参数 值 ; 同样 地 ， 服 务 器 返回 的 响应 将 包含 从 这 些 
过 程 返回 的 表达 值 。 

在 下 面 的 代码 中 ， 可 以 找到 一 个 调用 getstores 方法 的 例子 ， 此 例子 是 Alfres- 
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co 内 容 管 理 系统 实现 的 Web 服务 ， 此 处 仅 显示 SOAP 的 主体 元 素 : 
<soapenv:Body > 
<getstores xmlns =” http://www.alfresco. org/ws/service/repository/ 
150" > 
</getStores > 


</soapenv: Body > 
A possible response from the Alfresco server is shown as follows : 


一 种 从 服务 器 产生 的 可 能 的 响应 ， 如 下 所 示 : 


<soapenv:Body > 











<getStoresResponse 
xmlns =” http://www. alfresco. org/ws/service/repository/1.0” > 


<return xsi:type =”cms:store” > 


<1! --returns structured datatypes -- > 


</return > 

</getstoresResponse > 

</soapenv:Body > 

注意 ， 如 果 想 为 服务 实现 一 个 不 同 的 响应 信息 ， 响 应 方法 应 该 具有 与 请 求 方 
法 相同 的 名 字 ， 响 应 方法 的 名 字 后 级 为 Response。 在 这 一 特定 的 例子 中 ， 可 以 有 

1) 一 个 getStores 方法 作为 请 求 的 方法 。 

2) 一 个 getStoresResponse 方法 为 getStores 响应 的 方法 。 

如 果 不 想 为 方法 调用 定义 一 个 不 同 的 响应 消息 ， 那 么 ,该 SOAP 将 发 送 相同 
的 请 求 消息 使 用 不 同 的 时 间 惟 作为 默认 响应 ， 如 图 5-1 所 示 。 











响应 消息 


WS 客户 端 栈 加 WS 服务 器 栈 
请 求 消息 


图 5-1 SOAP 请 求 和 响应 示意 图 














5.2 REST 


5.2.1 REST 的 介绍 
REST 的 全 称 是 Representational State Transfer， 即 表征 状态 转移 ， 是 Roy 





"96 ， 企业 内 容 管理 理论 与 实践 





























Fielding 博士 在 2000 年 他 的 博士 论文 中 提出 来 的 一 种 软件 架构 风格 。REST 设计 
哲学 激 起 了 Web 与 企业 应 用 开发 者 的 无 尽 遐 想 ， 但 用 这 种 方式 来 开发 真正 的 
Web 服务 并 非 易 事 。 

首先 ， 先 前 并 没有 明确 地 区 分 HITP、RESTful HTTP 和 REST。 要 理解 这 些 
不 同方 面 之 间 的 关系 ， 我 们 要 先 来 看 看 REST 的 历史 。 

Roy Fielding 在 他 的 博士 学 位 论文 中 定义 了 术语 REST， 这 篇 论文 被 誉 为 
“REST 圣经 ” ， 这 是 恰当 的 ， 毕 竟 是 作者 发 明了 这 个 术语 ， 所 以 在 定义 上 ， 他 写 
的 任何 内 容 都 被 认为 是 权威 的 。Roy 曾 是 许多 基本 Web 协议 的 主要 设计 者 ， 其 
中 包括 HTTP 和 URI， 并 且 他 在 论文 中 对 这 些 协 议 提出 了 很 多 想法 。 在 论文 中 ， 
Roy 首先 定义 一 种 方法 论 来 谈论 架构 风格 一 一 高 级 、 抽 象 的 模式 ， 来 表达 架构 方 
法 背后 的 核心 理念 。 每 一 个 架构 风格 都 由 一 系列 的 约束 定义 形成 。 架 构 风 格 的 例 
子 包括 “没有 风格 ”( 根 本 没有 任何 约束 )、 管 道 和 过 滤器 、 客 户 端 /服务 器 、 分 
布 式 对 象 以 及 REST。 

REST 在 本 质 上 是 一 个 可 以 被 许多 不 同 技术 实现 的 高 层次 的 风格 ， 而 且 可 以 
被 实例 化 一 一 通过 为 它 的 抽象 特性 赋 上 不 同 的 值 。 比 如 ，REST 中 包含 资源 和 统 
一 接口 的 概念 一 一 也 就 是 说 ， 所 有 资源 都 应 该 对 这 些 相同 的 方法 做 出 反应 。 但 是 
REST 并 没有 说 明 是 哪些 方法 ,或 者 有 多 少 方法 。 

无 论 如 何 ， 整 体 上 来 说 Web、HTTP 和 URI 仅仅 是 REST 风格 的 一 个 主要 实 
现 。 不过， 由 于 Roy Fielding 即 是 REST 论文 的 作者 ， 又 对 Web 架构 设计 有 过 深 
远 的 影响 ， 两 者 相似 也 在 情理 之 中 。 

许多 使 用 HTTP 的 应 用 因为 一 些 理由 并 没有 遵循 REST 原则 ， 有 人 会 说 使 用 
HTTP 而 不 遵循 REST 原则 就 等 同 于 滥用 HTTP。 当 然 这 听 起 来 有 点 狂热 一 一 事实 
上 违反 REST 约束 的 原因 通常 是 ， 仅 仅 因 为 每 个 约束 带 来 的 设计 权衡 可 能 不 适合 
于 一 些 特殊 情况 。 但 通常 ， 违 背 REST 约束 的 原因 可 归咎 于 对 其 好 处 认 知 的 缺 
乏 。 来 看 一 个 明显 的 反面 案例 使 用 HTTP GET 调用 类 似 于 删除 对 象 的 操作 ， 这 
违反 了 REST 的 安全 约束 和 一 般 性 常识 。 

1. 宗旨 

REST 从 资源 的 角度 来 观察 整个 网 络 ， 分 布 在 各 处 的 资源 由 URI 确定 ， 而 客 
户 端的 应 用 通过 URI 来 获取 资源 的 表征 。 获 得 这 些 表 征 致使 这 些 应 用 程序 转变 
了 其 状态 。 随 着 不 断 获 取 资 源 的 表征 ， 客 户 端 应 用 不 断 地 在 转变 着 其 状态 ， 也 就 
是 所 谓 的 REST。 

这 一 观点 不 是 凭空 腾 造 的 ， 而 是 通过 观察 当前 Web 互联 网 的 运作 方式 而 抽 
象 出 来 的 。Roy Fielding 认为 :“ 设 计 良 好 的 网 络 应 用 表现 为 一 系列 的 网 页 ， 这 些 
网 页 可 以 看 作 虚 拟 的 状态 机 ， 用 户 选 择 这 些 链 接 导 致 下 一 网 页 传输 到 用 户 端 展现 
给 使 用 的 人 ， 而 这 正 代 表 了 状态 的 转变 。” 
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2. 要 点 及 标准 

需要 注意 的 是 ，REST 是 设计 风格 而 不 是 标准 。REST 通常 基于 使 用 HTTP、 
URI 和 XML 以 及 HTML 这 些 现 有 的 广泛 流行 的 协议 和 标准 。 

资源 是 由 URI 来 指定 ， 对 资源 的 操作 包括 获取 、 创 建 、 修 改 和 删除 资源 ， 
这 些 操 作 正 好 对 应 HTTP 提供 的 GET、POST、PUT 和 DELETE 方法 。 
通过 操作 资源 的 表现 形式 来 操作 资源 ， 资 源 的 表现 形式 则 是 XML 或 者 HT- 
ML， 取 决 于 读者 是 机 器 还 是 人 ， 是 消费 Web 服务 的 客户 软件 还 是 Web 浏览 
当然 也 可 以 是 任何 其 他 的 格式 。 

3. REST 的 要 求 

1) 客户 端 和 服务 器 结构 。 

2) 连接 协议 具有 无 状态 性 。 

3) 能 够 利用 Cache 机 制 增进 性 能 。 

4) 层次 化 的 系统 。 

5) 随 需 代 码 。 

4. 关于 状态 

应 该 注意 区 别 应 用 的 状态 和 连接 协议 的 状态 。REST 对 于 连接 的 无 状态 性 实 
际 上 要 求 每 次 经 过 无 状态 的 连接 协议 传送 的 信息 必须 包含 应 用 中 所 有 的 状态 
信息 。 

S。RESTful Web 服务 

RESTful Web 服务 (也 称 为 RESTful Web API) 是 一 个 使 用 HTTP 并 遵循 
REST 原则 的 Web 服务 。 它 从 以 下 三 个 方面 资源 进行 定义 : 

1) URI， 比 如 http: //example. com/resources/ 。 

2) Web 服务 接受 与 返回 的 互联 网 媒体 类 型 ， 比 如 JSON、XML、YAML 等 。 

3) Web 服务 在 该 资源 上 所 支持 的 一 系列 请 求 方法 (比如 POST、GET、PUT 
或 DELETE ) 。 














5.2.2 REST 关键 原则 


REST 定义 了 应 该 如 何 正确 地 使 用 (这 与 大 多 数 人 的 实际 使 用 方式 有 很 大 不 
同 ) Web 标准 ， 例 如 HTTP 和 URI。 如 果 你 在 设计 应 用 程序 时 能 坚持 REST 原 
则 ， 那 就 预示 着 你 将 会 得 到 一 个 使 用 了 优质 Web 架构 (这 将 让 你 受益 ) 的 系统 。 
总 之 ， 五 条 关键 原则 列举 如 下 : 

1) 为 所 有 “事物 ”定义 ID。 

2) 将 所 有 事物 链接 在 一 起 。 

3) 使 用 标准 方法 。 

4) 资源 多 重 表述 。 
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5) 无 状态 通信 。 
下 面 让 我 们 进一步 审视 这 些 原则 。 


5.2.3 为 所 有 “事物 ”定义 IDD 


在 这 里 使 用 了 “事物 ”来 代替 更 正式 准确 的 术语 “资源 ”， 因 为 一 条 如 此 简 
单 的 原则 ， 不 应 该 被 淹没 在 术语 当中 。 思 考 一 下 人 们 构建 的 系统 ， 通 常会 找到 一 
系列 值得 被 标识 的 关键 抽象 。 每 个 事物 都 应 该 是 可 标识 的 ， 都 应 该 拥有 一 个 明显 
的 了 D 一 一 在 Web 中 ， 代 表 ID 的 统一 概念 是 URI。URI 构成 了 一 个 全 局 命名 空 
间 ， 使 用 URI 标识 的 关键 资源 意味 着 它们 获得 了 一 个 唯一 、 全 局 的 ID。 

对 事物 使 用 一 致 的 命名 规则 最 主要 的 好 处 就 是 你 不 需要 提出 自己 的 规则 一 一 
而 是 依靠 某 个 已 被 定义 ， 在 全 球 范围 中 几乎 完美 运行 ， 并 且 能 被 绝 大 多 数 人 所 理 
解 的 规则 。 想 一 下 你 构建 的 上 一 个 应 用 (假设 它 不 是 采用 RESTful 方式 构建 的 ) 
中 的 任意 一 个 高 级 对 象 ， 那 就 很 有 可 能 看 到 许多 从 使 用 唯一 标识 中 受益 的 用 例 。 
比如 ， 如 果 你 的 应 用 中 包含 一 个 对 顾客 的 抽象 ， 那 么 可 以 相当 肯定 ， 用 户 会 希望 
将 一 个 指向 某 个 顾客 的 链接 ， 能 通过 电子 邮件 发 送 到 同事 那里 ,或 者 加 入 到 浏览 
器 的 书签 中 ， 甚 至 写 到 纸 上 。 更 透彻 地 讲 ， 如 果 在 一 个 类 似 于 Amazon. com 的 在 
线 商 城中 ,没有 用 唯一 的 ID (一 个 URI) 标识 它 的 每 一 件 商品 ， 可 想 而 知 这 将 
是 多 么 可 怕 的 业务 决策 。 

当面 对 这 个 原则 时 ， 许 多 人 惊讶 于 这 是 否 意 味 着 需要 直接 向 外 界 暴 露 数据 库 
记录 (或 者 数据 库 记 录 ID) ， 但 多 年 以 来 面向 对 象 的 实践 告诫 我 们 ， 要 将 持久 化 的 
言 息 作为 实现 细节 隐藏 起 来 之 后 ， 哪 怕 是 刚 有 点 想法 都 是 不 对 的 。 这 条 原则 与 隐藏 实 
现 细节 两 者 之 间 并 没有 任何 冲突 ; 通常 ， 值 得 被 URI 标识 的 事物 (资源) 要 比 数据 
库 记录 抽象 得 多 。 例 如 ， 一 个 订单 资源 可 以 由 订单 项 、 地 址 以 及 许多 其 他 方面 (可 
能 不 希望 作为 单独 标识 的 资源 暴露 出 来 ) 组成。 标识 所 有 值得 标识 的 事物 ， 领 会 这 
个 观念 可 以 进一步 引导 你 创造 出 在 传统 的 应 用 程序 设计 中 不 常见 的 资源 : 一 个 流程 或 
者 流程 步骤 、 一 次 销售 、 一 次 谈判 、 一 份 报价 请 求 一 一 这 都 是 应 该 被 标识 的 事物 的 
示例 。 同 样 ， 这 也 会 导致 创建 比 非 RESTful 设计 更 多 的 持久 化 实体 。 

下 面 是 一 些 你 可 能 想到 的 URI 的 例子 : 

http : //example. com/customers/1234 。 

http : //example. com/ orders/2007/10/776654。 

http: //example. com/ products/4554, 

http: //example. com/ processes/ salary-increase-234。 

正如 选择 了 创建 便于 阅读 的 URI 一 一 这 是 个 有 用 的 观点 ， 尽 管 不 是 RESTful 
设计 所 必需 的 一 一 应 该 能 十 分 容易 地 推测 出 URI 的 含义 : 它们 明显 地 标识 着 单 
一 “数据 项 ”。 但 是 青 往 下 看 : 
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http : //example. com/ orders/2007/11, 

http: //example. com/ products? color = green。 

首先 ， 这 两 个 URI 看 起 来 与 之 前 的 稍 有 不 同一 一 毕竟 ， 它 们 不 是 对 一 件 事 
物 的 标识 ， 而 是 对 一 类 事物 集合 的 标识 (假定 第 一 个 URI 标识 了 所 有 在 2007 年 
11 月 提交 的 订单 ， 第 二 个 则 是 绿 颜色 产品 的 集合 ) 。 但 是 这 些 集合 自身 也 是 事物 
(资源 ) ， 也 应 该 被 标识 。 

注意 ， 使 用 唯一 、 全 局 统一 的 命名 规则 的 好 处 ， 既 适用 于 浏览 器 中 的 Web 
应 用 ， 也 适用 于 机 对 机 通信 。 使 用 URI 标识 所 有 值得 标识 的 事物 ， 特 别 是 应 用 
中 提供 的 所 有 “高 级 ”资源 ， 无 论 这 些 资 源 代表 单一 数据 项 、 数 据 项 集合 、 虚 
拟 抑 或 实际 的 对 象 还 是 计算 结果 等 。 
5.2.4 将 所 有 事物 链接 在 一 起 

接 下 来 要 讨论 的 原则 是 “ 超 媒 体 被 当 作 应 用 状态 引擎 ” 。 这 个 描述 的 核心 是 
超 媒 体 概念 ， 换 名 话说， 是 链接 的 思想 。 链 接 是 我 们 在 HTML 中 常见 的 概念 ， 
但 是 它 的 用 处 绝 不 局 限于 此 。 考 虑 一 下 下 面 这 个 虚构 的 XML 片段 : 


<order self =” http://example. com/customers/1234” > 














<amount >23 </amount > 

<product ref =” http://example. com/products/4554” > 

<customer ref =” http://example. com/customers/1234” > 
</customer > </product > </order > 

如 果 你 观察 文档 中 product 和 customer 的 链接 » 就 可 以 很 容易 地 想 象 到 应 
用 程序 (已 经 检索 过 文档 ) 如 何 “ 跟 随 ” 链 接 检 索 更 多 的 信息 。 当 然 ， 如 果 使 
用 一 个 遵守 专用 命名 规范 的 简单 “id” 属 性 作为 链接 ， 也 是 可 行 的 一 一 但 是 仅 限 
于 应 用 环境 之 内 。 使 用 URI 表示 链接 的 优点 在 于 ， 链 接 可 以 指向 由 不 同 应 用 、 
不 同 服务 器 其 至 位 于 男 一 个 大 陆 上 的 不 同 公司 提供 的 资源 一 一 因为 URI 命名 规 
范 是 全 球 标准 ， 构 成 Web 的 所 有 资源 都 可 以 互联 互通 。 

超 媒体 原则 还 有 一 个 更 重要 的 方面 一 一 应 用 “状态 ”。 简 而 言 之 ， 实 际 上 服 
务 器 〈 如 果 你 愿意 ， 也 可 以 叫 服务 提供 者 ) 为 客户 端 (服务 消费 者 ) 提供 一 组 
链接 ， 使 客户 端 能 通过 链接 将 应 用 从 一 个 状态 改变 为 男 一 个 状态 。 链 接 是 构成 动 
态 应 用 的 非常 有 效 的 方式 。 

对 此 原则 总 结 如 下 : 任何 可 能 的 情况 下 ,使 用 链接 指引 可 以 被 标识 的 事物 
(资源 ) 。 也 正 是 超 链接 造就 了 现在 的 Web。 


5.2.5 使 用 标准 方法 
在 前 两 个 原则 的 讨论 中 暗含 着 一 个 假设 接收 URI 的 应 用 程序 可 以 通过 URI 
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明确 地 做 一 些 有 意义 的 事情 。 如 果 你 在 公共 汽车 上 看 到 一 个 URI， 你 可 以 将 它 输 
入 浏览 器 的 地 址 栏 中 并 回 车 ， 那 么 浏览 器 如 何 知道 需要 对 这 个 URI 做 些 什么 呢 ? 

它 知道 如 何 去 处 理 URI 的 原因 在 于 所 有 的 资源 都 支持 同样 的 接口 ， 一 套 同 
样 的 方法 集合 。 在 HTTP 中 这 被 叫做 动词 ， 除 了 两 个 大 家 熟知 的 GET 和 POST 之 
外 ， 标 准 方法 集合 中 还 包含 PUT、DELETE 、HEAD 和 OPTIONS。 这 些 方法 的 含 
义 连 同行 为 许诺 都 一 起 定义 在 HTTP 规范 之 中 。 如 果 你 是 一 名 面向 对 象 的 开发 人 
员 ， 就 可 以 想象 到 RESTful HTTP 方案 中 的 所 有 资源 都 继承 自 类 似 于 这 样 的 一 个 
类 (采用 类 Java、C# 的 伪 语法 描述 ， 请 注意 关键 的 方法 ) : 


class Resource | 





Resource( URI u);; 
Response get( ) ; 
Response post( Request r) ; 
Response put( Request r) ; 
Response delete( ) ; 
| 
由 于 所 有 资源 使 用 了 同样 的 接口 ， 你 
可 以 依 此 使 用 GET 方法 检索 一 个 表述 
也 就 是 对 资源 的 描述 。 
因为 规范 中 定义 了 GET 的 语义 ， 所 以 可 以 
肯定 当 你 调用 它 的 时 候 不 需要 对 后 果 负 
责 一 一 这 就 是 为 什么 可 以 “安全 ”地 调用 
此 方法 的 原因 。GET 方法 支持 非常 高 效 、 
成 熟 的 缓存 ， 所 以 在 很 多 情况 下 ， 你 甚至 
不 需要 向 服务 器 发 送 请 求 。 


OrderManagementService 


+ getOrders() 
+ SUbmitOrder() 
+ getOrderDetails() 





( representation ) 


+ getOrdersForCustomers() 
+ UpdateOrder!() 

+ addOrderltem() 

+ cancelOrder() 





如 果 你 采用 RESTful 的 方式 暴露 应 用 功 
能 ， 那 这 条 原则 和 它 的 约束 同样 也 适用 于 
你 。 如 果 你 已 经 习惯 于 另外 的 设计 方式 ， 
则 很 难 去 接受 这 条 原则 。 上 毕竟 ， 你 很 可 能 
认为 你 的 应 用 包含 了 超出 这 些 操作 表达 范 
围 的 逻辑 。 来 看 如 图 5-2 所 示 的 这 个 简单 
的 采购 方案 例子 。 

可 以 看 到 ， 例 子 中 定义 了 两 个 服务 程 








CustomerManagementService 


+ getCustomers() 

+ addCustomer() 

+ getCustomerDetails() 
+ UpdateCustomer() 

+ deleteCustomer() 


图 5-2 采购 方案 例子 的 服务 模型 


序 接口 ， 没 有 包含 任何 实现 细节 。 这 些 服务 程序 的 接口 都 是 为 了 完成 任务 ,为 
OrderManagement 和 CustomerManagement 服务 而 定制 的 。 如 果 客 户 程 序 试图 使 用 
这 些 服 务 ， 那 它 必须 针对 这 些 特定 接口 进行 编码 。 不 可 能 在 这 些 接口 定义 之 前 ， 
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使 用 客户 程序 去 有 目的 地 与 接口 协作 。 这 些 接口 定义 了 服务 程序 的 应 用 协议 。 
在 RESTful HTTP 方式 中 ， 你 将 通过 组 成 HTTP 应 用 协议 的 通用 接口 访问 服 
务 程 序 。 你 可 能 会 想 出 如 图 5-3 所 示 的 方式 。 


| rdes 
GET - list all orders 
一 一 一 -| PUT - unused 
POST - add a new order 
DELETE - unused 


| ordersidy 
GET - get order details 

六 一 一 一 二 PUT - update order 

POST - add item 

DELETE - cancel order 










Resource - 
GET GET -list all customers 
上 一 一 一 一 一 PUT - unused 


PUT 
POST 
DELETE 


POST - add new customer 
DELETE - unused 


/customers/{id} 


GET - get customer details 
PUT - update customer 
POST - unused 

DELETE - delete customer 


/customers/{id}Morders 


GET - get all orders for customer 
=- 一 一 一 让 PUT -unused 
POST - add order 











DELETE - cancel all customer orders 








图 5-3 采购 方案 例子 的 接口 服务 映射 为 HTTP 方法 


可 以 看 到 ， 服 务 程序 中 的 特定 操作 被 映射 成 为 标准 的 HTTP 方法 。 为 了 消除 
歧义 ， 创 建 了 一 组 全 新 的 资源 。 标 识 一 个 顾客 的 URI 上 的 GET 方法 正好 相当 于 
getCustomerDetails 操作 ; 图 5-4 所 示 的 三 角形 ， 形 象 化 地 说 明了 这 一 点 。 

把 三 个 顶点 想象 为 你 可 以 调节 的 按钮 。 可 以 看 到 在 第 一 种 方法 中 ， 你 拥有 许 
多 操作 、 许 多 种 类 的 数据 以 及 固定 数量 的 “实例 ”( 本 质 上 与 你 拥有 的 服务 程序 
数量 一 致 ) 。 在 第 二 种 方法 中 ， 你 拥有 固定 数量 的 操作 、 许 多 种 类 的 数据 和 许多 
调用 固定 方法 的 对 象 。 它 的 意义 在 于 ,证 明了 通过 这 两 种 方式 ， 基 本 上 可 以 表示 
任何 你 喜欢 的 事情 。 

为 什么 使 用 标准 方法 如 此 重要 ? 从 根本 上 说 ， 它 使 你 的 应 用 成 为 Web 的 一 
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部 分 一 一 应 用 程序 为 Web 变 成 Internet 
上 最 成 功 的 应 用 所 做 的 贡献 ， 与 它 添 
加 到 Web 中 的 资源 数量 成 比例 。 采 用 
RESTful 方式 ， 一 个 应 用 可 能 会 向 Web 
中 添加 数 以 百 万 计 的 客户 URI; 如 果 
采用 CORBA 技术 并 维持 应 用 的 原 有 设 
计 方 式 ， 那 它 的 贡献 大 抵 只 是 一 个 
“端点 (endpoint)”， 就 好 比 一 个 非常 Operations Instances 
小 的 门 ， 仅 仅 人 允许 有 钥匙 的 人 进入 其 。” 图 5-4 采购 方案 例子 的 操作 模型 示例 
Ww 
一 接口 也 使 得 所 有 理解 HTTP 应 用 协议 的 组 件 能 与 你 的 应 用 交互 。 通 用 客 
Pp tt te pe 例如 curl、wget、 人 代理、 缓存 、HTTP 服务 
器 、 网 关 还 有 Yahoo! 、MSN 等 。 
为 使 客户 端 程序 能 与 你 的 资源 相互 协作 ， 资 源 应 该 正确 地 实现 默认 的 应 用 协 
议 (HTTP) ， 也 就 是 使 用 标准 的 GET、PUT、POST 和 DELETE 方法 。 


5.2.6 资源 多 重 表述 


到 目前 为 止 一 直 忽 略 了 一 个 稍微 复杂 的 问题 ， 客 户 程 序 如 何 知 道 该 怎样 处 理 
仿 索 到 的 数据 ， 比 如 作为 CET 或 者 POST 请 求 的 结果 ? 原因 是 ，HTTP 采取 的 方 
式 是 允许 数据 处 理 和 操作 调用 之 间 关 系 分 离 的 。 换 句 话说 ， 
何 处 理 一 种 特定 的 数据 格式 ， 那 就 可 以 与 所 有 提供 这 种 表述 格式 的 资源 交互 。 
我 们 再 用 一 个 例子 来 前 明 这 个 观点 。 利 用 HTTP 内 容 协商 (content ee 5 
客户 程序 可 以 请 求 一 种 特定 格式 的 表述 : 

GET /customers/1234 HTTPZ1. 1 


Host : example. com 


Data types 





























Accept: application/ vnd. mycompany. customer + xml 

请 求 的 结果 可 能 是 一 些 由 公司 专 有 的 XML 格式 表述 的 客户 信息 。 假 设 客 户 
程序 发 送 另外 一 个 不 同 的 请 求 ， 就 如 下 面 这 样 : 

GET /customers/1234 HTTP/1.1 


Host: example. com 








ee text/x- vcard 
结果 则 可 能 是 VCard 格式 的 客户 地 址 。 这 里 没有 展示 响应 的 内 容 ， 在 其 HT- 
TP Content-type 头 中 应 该 包含 着 关于 数据 类 型 的 元 数据 。 这 说 明 为 什么 理想 的 情 
况 下 ， 资 源 表 述 应 该 采用 标准 格式 一 一 如 果 客 户 程序 对 HTTP 应 用 协议 和 一 组 数 
据 格 式 都 有 所 了 解 ， 那 么 它 就 可 以 用 一 种 有 意义 的 方式 与 世界 上 任意 一 个 REST- 
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ful HTTP 应 用 交互 。 不 幸 的 是 ， 我 们 不 可 能 拿 到 所 有 东西 的 标准 格式 ， 但 是 ， 或 
许 我 们 可 以 想到 在 公司 或 者 一 此 合作 伙伴 中 使 用 标准 格式 来 营造 一 个 小 环境 。 当 
然 以 上 情况 不 仅 适 用 于 从 服务 器 到 客户 端的 数据 ， 反 之 倘若 从 客户 端 传 来 的 数据 
符合 应 用 协议 ， 那 么 服务 器 就 可 以 使 用 特定 的 格式 处 理 数 据 ， 而 不 去 关心 客户 端 
的 类 型 。 

在 实践 中 ， 资 源 多 重 表述 还 有 着 其 他 重要 的 好 处 : 如 果 你 为 你 的 资源 提供 
HTML 和 XML 两 种 表述 方式 ， 那 这 些 资源 不 仅 可 以 被 你 的 应 用 所 用 ， 还 可 以 被 
任意 标准 Web 浏览 器 所 用 。 也 就 是 说 ,你 的 应 用 信息 可 以 被 所 有 会 使 用 Web 的 
人 获取 到 。 

资源 多 重 表 述 还 有 另外 一 种 使 用 方式 : 你 可 以 将 应 用 的 Web UI 纳入 到 Web 
API 中 。 上 毕竟，API 的 设计 通常 是 由 UI 可 以 提供 的 功能 驱动 的 ， 而 UI 也 是 通过 
API 执行 动作 的 。 将 这 两 个 任务 合 二 为 一 带 来 了 令 人 惊讶 的 好 处 ， 这 使 得 使 用 者 
和 调用 程序 都 能 得 到 更 好 的 Web 接口 。 


5.2.7 无 状态 通信 


无 状态 通信 是 要 讲 到 的 最 后 一 个 原则 。 需 要 着 重 强 调 的 是 ， 虽然 
REST 包含 无 状态 性 ( statelessness) 的 观念 ， 但 这 并 不 是 说 暴露 功能 的 
应 用 不 能 有 状态 。 事 实 上 ， 在 大 部 分 情况 下 这 会 导致 整个 做 法 没有 任何 
用 处 。REST 要 求 状 态 要 么 被 放 人 资源 状态 中 ， 要 么 保存 在 客户 端 上 。 
或 者 换 名 话说， 服务 器 不 能 保持 除了 单 次 请 求 之 外 的 ,任何 与 其 通信 的 
客户 端的 通信 状态 。 这 样 做 的 最 直接 的 理由 就 是 可 伸缩 性 。 如 果 服 务 器 
需要 保持 客户 端 状 态 ， 那么 大 量 的 客户 端 交互 会 严重 影响 服务 器 的 内 存 
可 用 空间 。 

要 做 到 无 状态 通信 往往 需要 重新 设计 ， 不 能 简单 地 将 一 些 会 话 状态 绑 缚 在 
URI 上 ， 然 后 就 宣称 这 个 应 用 是 RESTful。 

除 此 以 外 ， 其 他 方面 可 能 显得 更 为 重要 : 无 状态 约束 使 服务 器 的 变化 对 客户 
端 是 不 可 见 的 ， 因 为 在 两 次 连续 的 请 求 中 ， 客 户 端 并 不 依赖 于 同一 台 服 务 器 。 一 
个 客户 端 从 某 台 服务 器 上 收 到 一 份 包含 链接 的 文档 ， 当 它 要 做 一 些 处 理 时 ,这 台 
服务 器 宕 机 了 ， 可 能 是 硬盘 坏 掉 而 被 拿 去 修理 ， 可 能 是 软件 需要 升级 重启 。 如 果 
这 个 客户 端 访问 了 从 这 台 服 务 器 接收 的 链接 ， 它 不 会 察觉 到 后 台 的 服务 器 已 经 改 
变 了 。 















































5.3 SOAP 对 比 REST 





虽然 当前 主流 的 方式 明显 地 集中 在 基于 SOAP、WSDL 和 WS 规范 的 Web 服 
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务 领域 , 但 目前 在 三 种 主流 的 Web 服务 实现 方案 中 ， 因 为 REST 模式 的 Web 服 





务 与 复杂 的 SOAP 和 XML-RPC 对 比 来 讲 明显 地 更 加 简洁 ， 

















越 来 越 多 的 Web 服务 


开始 采用 REST 风格 设计 和 实现 。 例 如 ，Amazon. com 提供 接近 REST 风格 的 Web 
服务 进行 图 书 查找 ; 雅虎 提供 的 Web 服务 也 是 REST 风格 的 。 
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6.1 集中 式 体 系 结构 


集中 式 系统 是 指 中 心 节点 由 一 台 或 多 台 主 计算 机 组 成 ， 数 据 集中 存储 于 主机 
中 ， 该 系统 所 有 功能 由 主机 集中 处 理 ， 由 终端 或 客户 机 负责 数据 录入 和 输出 ， 数 
据 的 存储 处 理 控制 完全 由 主机 完成 。 

大 型 内 容 管理 系统 的 开发 者 首先 要 思考 的 问题 是 ， 如 何 获得 一 致 性 和 数据 的 
独立 性 ?如何 保 证 所 存储 的 项 是 可 检索 的 而 不 会 丢失 在 数据 库 的 大 量 信息 之 中 ? 
解决 办 法 之 一 是 建立 一 个 集中 式 系统 ， 在 此 系统 中 所 有 内 部 级 数据 、 记 录 、 文 件 
和 所 有 用 户 接口 都 由 一 组 集中 的 中 央 程 序 控制 。 
通常 ， 集 中 式 系统 使 用 星 形 拓扑 结构 。 最 
简单 的 例子 中 ， 只 有 一 台 集 中 式 服务 器 及 与 其 
相连 的 所 有 客户 端 组 成 ， 如 图 6-1 所 示 ， 星 形 
结构 适合 于 数量 较 少 的 网 络 连接 ， 同 时 ， 它 仍 
然 允 许 系统 的 任何 部 分 与 其 他 部 分 进行 通信 。 

集中 式 系统 有 如 下 一 些 优点 

1. 一 致 性 

由 于 所 有 数据 项 由 一 组 中 央 程 序 所 控制 ， 图 6-1 集中 式 体系 结构 
则 避免 了 一 组 数据 的 多 重 目录 ， 因 为 多 重 目录 
可 能 导致 不 一 致 性 。 

2. 可 检索 性 

中 央 控制 程序 可 保证 所 有 的 数据 项 是 标准 格式 的 ， 对 信息 的 访问 也 是 标准 
的 、 兼 容 的 格式 ， 这 样 任何 数据 都 不 可 能 轻易 丢失 。 

3. 数据 的 独立 性 

用 户 应 用 程序 应 不 受 数据 存储 和 访问 方式 变化 的 影响 ， 这 种 功能 在 中 央 程序 
控制 所 有 内 部 级 数据 、 数 据 存储 和 用 户 接口 时 ， 比 较 容易 实现 。 

集中 式 系统 有 这 么 多 重要 的 优点 ， 但 是 ， 其 缺点 也 是 致命 的 。 集 中 式 系统 虽 
然 效率 高 ， 但 它 可 能 满足 不 了 用 户 多 样 性 的 要 求 。 由 于 终端 的 异 构 性 ， 使 得 终端 
的 数据 访问 方法 可 能 大 不 相同 ， 因 而 所 选择 的 最 佳 数据 存储 方法 和 访问 结构 也 必 
然 不 同 。 集 中 式 数据 库 系 统 不 能 解决 这 些 终端 差异 化 的 问题 。 
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6.2 C/S 体系 结构 


6.2.1 C/S 模型 


CL/S (客户 端 /服务 器 ) 结构 是 大 家 熟知 的 客户 端 和 服务 器 结构 。 它 是 一 种 
软件 系统 体系 结构 ， 通 过 它 可 以 充分 利用 两 端 硬 件 环境 的 优势 ， 将 任务 合理 分 配 
到 客户 端 和 服务 器 来 实现 ， 降 低 了 系统 的 通信 开销 。 目 前 大 多 数 应 用 软件 系统 都 
是 CLS 形式 的 两 层 结 构 ， 由 于 现在 的 软件 应 用 系统 正在 向 分 布 式 的 Web 应 用 发 
展 ，Web 和 C/S 应 用 都 可 以 进行 同样 的 业务 处 理 ， 应 用 不 同 的 模块 共享 逻辑 组 
件 。 因 此 ， 内 部 的 和 外 部 的 用 户 都 可 以 访问 新 的 和 现 有 的 应 用 系统 ， 通 过 现 有 应 
用 系统 中 的 逻辑 可 以 扩展 出 新 的 应 用 系统 。 这 也 是 目前 应 用 系统 的 发 展 方向 。 

最 简单 的 C/S 模式 应 用 由 两 部 分 组 成 ， 即 客户 应 用 程序 和 数据 库 服 务 器 程 
序 ， 两 者 可 分 别称 为 前 台 程 序 和 后 台 程 序 ， 如 图 6-2 所 示 。 运 行 数据 库 服务 带 程 
序 的 机 器 称 为 应 用 服务 器 。 服 务 器 程序 启动 后 ， 随 时 等 待 相应 客户 端 程序 发 来 的 
请 求 ; 客户 端 程序 在 客户 使 用 的 计算 机 上 运行 ， 即 在 客户 机 上 运行 。 当 需要 对 数 
据 库 中 的 数据 进行 访问 时 ， 
客户 程序 自动 寻找 服务 器 程 请 求 


本 
序 ， 并 向 其 发 出 请 求 ， 服 务 EE _ ee 
器 程序 根据 预订 的 规则 进行 


客户 庙 
应 答 ， 送 回 结果 。 

C/S 模式 中 ， 服 务 器 通常 人 
采用 高 性 能 的 PC、 工作 站 或 
小 型 机 ， 并 采用 大 型 数据 库 系 统 ， 如 ORACLE 、SYBASE 、Informix 或 SQL Serv- 
er。 客 户 端 需要 安装 专用 的 客户 端 软 件 。 

传统 的 C/S 体系 结构 虽然 采用 的 是 开放 模式 ， 但 这 只 是 系统 开发 一 级 的 开 
放 性 ， 在 特定 的 应 用 中 无 论 是 客户 端 ， 还 是 服务 器 都 还 需要 特定 的 软件 支持 。 由 
于 没 能 提供 用 户 真 正 期 望 的 开放 环境 ，C/S 结构 的 软件 需要 针对 不 同 的 操作 系统 
开发 不 同 版 本 的 软件 , 加 之 产品 的 更 新 换代 十 分 快 ， 已 经 很 难 适应 百 台 计算 机 以 
上 局 域 网 用 户 同 时 使 用 ， 而 且 代价 高 ， 效 率 低 。 


6.2.2 C/S 架构 的 特点 


1. C/S 结构 的 优点 
1) C/S 能 充分 发 挥 客户 端 PC 的 处 理 能 力 ， 很 多 工作 可 以 在 客户 端 处 理 后 
再 提交 给 服务 器 ， 对 应 的 优点 就 是 客户 端 响应 速度 快 。 
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2) 应 用 服务 器 运行 数据 负荷 较 轻 。 最 简单 的 C/S 体系 结构 的 数据 库 应 用 由 
两 部 分 组 成 ， 即 客户 应 用 程序 和 数据 库 服 务 器 程序 ， 两 者 可 分 别称 为 前 台 程 序 与 
吾 台 程序 。 运 行 数 据 库 服务 器 程序 的 机 器 ， 也 称 为 应 用 服务 器 。 一 旦 服务 器 程序 
被 启动 ， 就 随时 等 待 响应 客户 程序 发 来 的 请 求 ; 客户 应 用 程序 运行 在 用 户 自 己 的 
计算 机 上 ， 对 应 于 数据 库 服务 器 ， 可 称 为 客户 计算 机 ， 当 需要 对 数据 库 中 的 数据 
进行 任何 操作 时 ， 客 户 程序 就 自动 地 寻找 服务 器 程序 ， 并 向 其 发 出 请 求 ， 服 务 器 
程序 根据 预定 的 规则 做 出 应 答 ， 送 回 结果 ， 应 用 服务 器 运行 数据 负荷 较 轻 。 

3) 数据 的 存储 管理 功能 较为 透明 。 在 数据 库 应 用 中 ， 数 据 的 存储 管理 功能 
是 由 服务 器 程序 和 客户 应 用 程序 分 别 独立 进行 的 ， 前 台 应 用 可 以 违反 规则 ， 并 且 
通常 把 那些 不 同 的 运行 数据 ， 在 服务 器 程序 中 不 集中 实现 。 对 于 工作 在 前 台 程 序 
上 的 最 终 用 户 ， 服 务 器 的 功能 是 “透明 ”的 。 在 C/S 架构 的 应 用 中 ， 前 台 程 序 
非常 简单 ， 复 杂 的 运算 功能 都 交 由 服务 器 来 执行 。 

2. C/S 架构 的 劣势 

C/S 架构 的 劣势 在 于 投资 大 且 维 护 成 本 大 ， 原 因 如 下 : 

1) 只 适用 于 局 域 网 。 随 着 互联 网 的 飞速 发 展 ， 移 动 办 公 和 分 布 式 办 公 越 来 
越 普 及 ， 这 需要 系统 具有 扩展 性 。 这 种 方式 远程 访问 需要 专门 的 技术 ， 同 时 要 对 
系统 进行 专门 的 设计 来 处 理 分 布 式 的 数据 。 

2) 客户 端 需要 安装 专用 的 客户 端 软件 。 首 先 涉及 安装 的 工作 量 ， 其 次 任何 
一 台 计 算 机 出 问题 ， 如 病毒 、 硬 件 损坏 都 需要 进行 安装 或 维护 。 特 别 是 有 很 多 分 
部 的 情况 下 ， 路 程 的 问题 更 加 突出 。 当 系统 软件 升级 时 ， 每 一 台 客 户 机 都 需要 重 
新 安装 ， 其 维护 和 升级 成 本 非常 高 。 

3) 采用 C/S 架构 ， 要 选择 适当 的 数据 库 平 台 来 实现 数据 的 真正 “统一 ”， 
使 分 布 于 两 地 的 数据 同步 完全 交 由 数据 库 系统 去 管理 ， 但 逻辑 上 两 地 的 操作 者 要 
直接 访问 同一 个 数据 库 才 能 有 效 实现 ， 有 这 样 一 些 问题 ， 如 果 需 要 建立 “实时 ?” 
的 数据 同步 ， 就 必须 在 两 地 间 建 立 实时 的 通信 连接 ， 保 持 两 地 的 数据 库 服务 器 在 
线 运行 ， 网 络 管理 人 员 既 要 对 服务 器 维护 管理 ， 又 要 对 客户 端 维护 和 管理 ， 这 需 
要 高 昂 的 投资 和 复杂 的 技术 支持 ， 维 护 成 本 很 高 ， 维 护 任务 量 大 。 

4) 对 客户 端的 操作 系统 通常 会 有 限制 。 大 部 分 客户 端的 软件 不 具备 跨 平台 
性 。 在 Java 这 样 的 跨 平台 语言 出 现 之 后 ，C/S 受到 了 B/S 架构 的 猛烈 冲击 ， 并 
对 其 形成 威胁 和 挑战 。 






































6.3 B/S 体系 结构 


B/S 即 BrowserServer， 浏 览 器 /服务 器 结构 ， 是 随 着 Internet 技术 兴起 的 模 
式 ， 是 对 C/S 结构 的 一 种 变化 或 者 改进 的 结构 。B/S 架构 经 历 了 两 层 模型 、 三 
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层 模 型 到 四 层 架构 的 演变 。 
6.3.1 B/S 两 层 模型 
两 层 即 浏览 器 /服务 器 ， 在 Web 发 展 的 初期 ，Web 应 用 主要 通过 静态 页 面 在 


Internet 上 发 布 信息 ， 用 户 通 过 诸 3 
浏览 器 向 服务 器 发 送 请 求 ， 服 os 
务 器 接受 客户 端的 请 求 ， 向 客 ee 
户 端 发 送 所 请 求 的 页 面 ， 如 图 
6-3 所 示 。 

在 这 种 结构 下 ， 网 站 上 的 页 面 是 静态 的 ， 无 法 根据 用 户 的 实际 情况 做 动态 的 
变化 ， 网 站 的 信息 提供 者 通过 更 新 服务 器 上 的 网 页 信息 来 向 用 户 提供 最 新 的 信 
息 。 用 户 和 浏览 器 之 间 只 能 实现 有 限 的 交互 ， 网 站 和 用 户 之 间 几 乎 没有 交互 。 


6.3.2 B/S 三 层 模型 


此 模型 由 Internet 技术 与 三 层 C/S 相 结 合 产 生 的 。 在 此 模式 中 ， 客 户 端 上 运 
行 的 应 用 程序 是 浏览 器 ， 中 间 层 是 Web 服务 器 和 服务 器 扩展 程序 ， 当 用 户 通过 
浏览 器 向 分 布 在 网 络 上 的 许多 服务 器 发 出 请 求 ，Web 服务 器 将 其 转换 成 数据 库 
服务 器 能 够 接受 的 形式 ， 再 通过 数据 网 关 与 数据 库 进 行 数据 交换 ;客户 端 上 只 需 
安装 、 配 置 少量 的 客户 端 软件 即 可 ， 服 务 需 承担 更 多 的 工作 ， 对 数据 库 的 访问 和 
应 用 程序 的 执行 在 服务 器 上 完成 。 当 收 到 浏览 器 请 求 时 ，Web 服务 顺 不 需要 产 
生 新 的 进程 ， 在 本 身 的 进程 空间 处 理 请 求 ， 避 人 免 了 系统 瘫痪 的 危险 ， 如 图 6-4 
所 示 。 














B/S 两 层 模型 




















3 
全 4 
本 请 求 
浏览 器 滑 训 Web 服 务 器 二 | 
图 6-4 B/S 三 层 结构 服务 模式 


三 层 模型 即 表示 层 、 应 用 逻辑 层 、 数 据 服 务 层 。 在 B/S 三 层 体系 结构 下 ， 
这 三 层 被 分 为 三 个 相对 独立 的 单元 ， 如 图 6-5 所 示 。 


图 6-5 ”B/S 三 层 结构 

表示 层 ( Presentation) ， 即 Web 浏览 句 。 该 层 中 包含 系统 的 显示 逻辑 ， 位 
于 客户 端 。 它 的 任务 是 由 Web 浏览 器 向 网 络 上 的 某 一 Web 服务 器 提出 服务 请 
求 ，Web 服务 器 对 用 户 身份 进行 验证 后 用 HTTP 把 所 需 的 主页 传送 给 客户 端 ， 客 
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户 端 接收 传 来 的 主页 文件 ， 并 把 它 显 示 在 Web 浏览 句 上 。 应 用 逻辑 层 ( Business 
Logic) ， 具 有 应 用 程序 扩展 功能 的 Web 服务 器 。 该 层 中 包含 系统 的 事务 处 理 逻 
辑 ， 位 于 Web 服务 器 。 它 的 任务 是 接受 用 户 的 请 求 ， 首 先 需 要 执行 相应 的 扩展 
应 用 程序 与 数据 库 进行 连接 ， 通 过 SQL 等 方式 向 数据 库 提 出 数据 处 理 申 请 ， 而 
后 等 数据 库 服 务 器 将 数据 处 理 的 结果 提交 给 Web 服务 器 ， 再 由 Web 服务 器 传送 
回 客户 端 。 数 据 服务 层 (Data Service) 即 数据 库 服务 器 。 该 层 中 包含 系统 的 数 
据 处 理 逻 辑 ， 位 于 数据 库 服务 器 。 它 的 任务 是 接受 Web 服务 器 对 数据 库 操作 的 
请 求 ， 实 现 对 数据 库 查 询 、 修 改 、 更 新 等 功能 ， 把 运行 结果 提交 给 Web 服务 器 。 

B/S 结构 从 根本 上 改变 了 传统 的 两 层 CAS 体系 结构 的 缺陷 ， 简 化 了 客户 端 
的 工作 ， 用 户 只 要 装 有 浏览 器 ， 就 可 以 通过 互联 网 连接 远程 服务 器 接受 服务 。 用 
浏览 器 做 用 户 界面 ， 无 需 开 发 客户 端 程序 ， 开 发 任务 只 集中 在 Web 服务 器 ， 方 
便 开 发 同时 也 提高 开发 的 效率 ; 同时 由 于 客户 端 把 事务 处 理 逻 辑 部 分 分 给 了 应 用 
服务 器 ， 使 客户 端 变 得 简单 了 ， 不 再 负责 处 理 复 杂 计 算 和 数据 访问 等 关键 事务 ， 
只 负责 显示 部 分 当 软 件 需 要 完善 时 ， 只 需要 对 服务 器 程序 进行 相应 的 操作 。 

在 这 种 结构 下 ， 用 户 界面 完全 通过 WWW 浏览 器 实现 ， 一 部 分 事务 逻辑 在 
前 端 实现 ， 但 是 主要 事务 逻辑 在 服务 器 实现 。B/VS 结构 可 以 利用 不 断 成 熟 的 
WWW 浏览 器 技术 ， 用 通用 浏览 器 就 实现 了 原来 需要 复杂 专用 软件 才能 实现 的 强 
大 功能 ， 节 约 了 开发 成 本 ， 是 一 种 全 新 的 软件 系统 构造 技术 。 随 着 浏览 名 技术 被 
植 人 操作 系统 内 部 ， 这 种 结构 更 成 为 当今 应 用 软件 体系 结构 的 首选 。 

三 层 结构 的 主要 优点 如 下 : 

1) 应 用 系统 处 理 逻 辑 与 数据 库 系统 分 开 ， 数 据 库 内 容 更 新 不 影响 应 用 系统 
处 理 逻 辑 。 

2) 专门 的 应 用 服务 器 处 理 客户 请 求 ， 并 与 数据 库 通信 ， 提 高 了 数据 库 的 访 
问 效率 。 

3) 数据 处 理 和 数据 库 操 作 任务 移 到 服务 器 执行 ， 客 户 端 上 只 要 能 够 运行 浏 
览 句 即 可 。 

4) 与 两 层 结构 相 比 ， 三 层 结构 从 根本 上 解决 了 终端 异 构 的 问题 。 


6.3.3 B/S 四 层 模型 


有 些 应 用 的 逻辑 处 理 非常 复杂 时 ， 在 应 用 层 专 门 有 一 些 功能 完成 请 求 转 发 和 
应 用 逻辑 相关 处 理 的 任务 ， 于 是 出 现 了 新 的 四 层 体系 结构 ， 将 应 用 逻辑 处 理 和 应 
用 的 表示 相 分 离 ， 如 图 6-6 所 示 。 

其 中 ，Web 服务 融 即 动态 页 面 所 在 层 主要 负责 应 用 的 表示 ， 应 用 服务 器 主 
要 负责 应 用 的 逻辑 处 理 。 在 此 体系 结构 中 ， 用 户 通过 浏览 器 向 服务 器 发 送 请 求 ， 
Web 服务 器 接受 客户 端 发 送 过 来 的 请 求 ， 对 请 求 分 析 转 换 ， 调 用 应 用 服务 带 响 
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性 -一 了 


一 一 一 
浏览 器 和 web 服务 器 | | 应 用 服务 器 | 


图 6-6 B/S 四 层 模 型 


应 的 逻辑 处 理 程 序 ， 逻 辑 处 理 程序 可 与 数据 库 交 互 ， 将 四 辑 处 理 结果 返回 给 
Web 服务 器 ， Web 服务 器 再 将 结果 发 送 给 客户 端 浏览 器 。 增 加 了 应 用 服务 器 功 
能 ， 可 以 将 一 些 性 能 、 安 全 的 功能 放置 在 这 一 层 。 

为 了 提高 系统 的 可 伸缩 性 ， 增 加 并 发 性 能 ， 在 大 量 并 发 访问 的 情况 下 ，Web 
服务 器 可 处 理 的 并 发 请 求 数 可 以 在 中 间 件 一 层 上 得 到 更 进一步 的 扩展 ， 提 高 系统 
整体 的 并 发 链接 数 。 

在 网 络 结构 的 设计 中 ，Web 服务 器 一 般 都 可 以 被 前 端 用 户 访问 到 ， 这 样 增 
加 了 数据 安全 风险 ， 增 加 了 应 用 服务 器 层 ， 可 以 隔离 Web 服务 器 对 企业 数据 库 
的 访问 请 求 ， 来 自用 户 的 请 求 首先 被 中 间 件 层 处 理 ， 中 间 件 完成 数据 库 访问 后 将 
结果 通过 Web 服务 器 返回 给 用 户 。 对 于 ECM 来 说 ， 企 业 数据 是 企业 的 生命 力 体 
现 ， 采 用 四 层 架 构 将 是 ECM 的 必然 选择 。 


6.4 并 行 计 算 

















6. 4.1 并 行 计算 定义 及 特征 

在 经 历 了 漫长 的 串 行 计算 之 后 ， 为 了 解决 更 大 更 复杂 的 计算 问题 ， 在 串 行 的 
基础 上 演变 出 了 并 行 计算 。 并 行 计 算 或 称 平行 计算 是 相对 于 串 行 计算 来 说 的 ， 串 
行 计 算是 指 在 具有 中 央 处 理 器 的 单个 计算 机 上 执行 一 些 操作 ， 并 行 计算 就 是 在 多 
台 计 算 机 上 对 同一 个 问题 的 不 同方 面 在 同一 个 时 间 进 行 分 块 操作 。 并 行 计 算 可 分 
为 时 间 上 的 并 行 和 空间 上 的 并 行 。 时 间 上 的 并 行 就 是 指 流水 线 技术 ， 而 空间 上 的 
并 行 则 是 指 用 多 个 处 理 器 并 发 地 执行 计算 。 

为 利用 并 行 计算 进行 较 快 计算 的 需要 ， 有 助 于 同时 解决 问题 ， 通 常 将 复杂 的 
计算 问题 分 割 成 离散 的 部 分 ， 随 时 并 及 时 执行 多 个 程序 指令 ， oe 下 ， 
解决 问题 的 耗 时 比 单个 计算 资源 下 的 耗 时 要 少 。 

6. 4.2 并行 计 算 体系 结构 

并 行 计算 科学 中 主要 研究 的 是 空间 上 的 并 行 问题 。 从 程序 和 算法 设计 人 员 的 
角度 来 看 ， 并 行 计算 又 可 分 为 数据 并 行 和 任务 并 行 。 一 般 来 说 ， 因 为 数据 并 行 主 
要 是 将 一 个 大 任务 化 解 成 相同 的 各 个 子 任务 ， 比 任务 并 行 要 容易 处 理 。 

空间 上 的 并 行 导 致 了 两 类 并 行 机 的 产生 ，M. J. Flynn 将 计算 机 体系 结构 分 为 
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单 指令 流 多 数据 流 (SIMD ) 和 多 指令 流 多 数据 流 (MIMD) 。 常 用 的 串 行 机 也 叫 
做 单 指令 流 单数 据 流 (SISD) 。MIMD 类 的 机 器 又 可 分 为 以 下 和 常见 的 五 类 : 并 行 
向 量 处 理 机 (PVP) 、 对 称 多 处 理 机 (SMP) 、 大 规模 并 行 处 理 机 (MPP) 、 工 作 
站 机 群 ( Cluster of Workstation ) 、 分 布 式 共享 存储 处 理 机 (DSM) 。 

1) 并 行 向 量 处 理 机 (PVP) ， 使 用 大 量 的 向 量 存储 器 和 质量 缓冲 器 ， 不 使 
用 高 速 缓存 。Cray C-90 、Cray T-90、NEC SX4 和 我 国 的 银河 一 号 都 是 并 行 向 量 
处 理 机 。 

2) 对 称 多 处 理 机 (SMP) ， 多 应 用 于 商务 上 ， 像 及 时 的 事务 处 理 数据 库 等 。 
它 是 由 高 速 总 线 或 者 交叉 开关 连接 微 处 理 器 ， 再 将 这 些微 处 理 器 连 向 共享 存储 
器 。 因 为 系统 是 对 称 的 ， 因 而 得 名 对 称 多 处 理 器 。 正 因为 系统 的 对 称 性 ， 每 个 服 
务 器 访问 共享 存储 器 、LO 设备 和 操作 系统 等 是 等 同 的 ， 增 强 了 并 行 度 ， 但 是 却 
因此 限制 了 处 理 器 的 数量 。IBM R50 SGI Power Challenge 、DEC alpha 服务 器 和 我 
国 的 电光 一 号 都 是 这 种 对 称 多 处 理 机 。 

3) 大 规模 并 行 处 理 机 ( Massively Parallel Processor，MPP)， 是 指 由 几 百 或 
几 千 台 处 理 机 组 成 的 大 规模 并 行 计算 机 系统 。Intel 和 美国 Sandia 国家 实验 室 
1997 年 6 月 研制 成 功 的 MPP 系统 ASCI Option Red 有 9216 个 处 理 器 。MPP 系统 
中 处 理 器 数目 巨大 ， 整 个 系统 规模 庞大 ,许多 硬件 设备 是 专门 设计 制造 的 ， 开 发 
起 来 比较 困难 ， 通 常 被 视 为 国家 综合 实力 的 象征 。 同 时 ，MPP 能 够 提供 其 他 并 
行 计算 机 不 能 达到 的 计算 能 力 ， 达 到 3T 性 能 日 标 ， 解决 重大 挑战 性 课题 都 寄 希 
望 于 MPP。 但 是 ,目前 性 能 最 好 的 MPP 的 水 平 距 离 实 际 的 需求 还 有 不 小 的 差距 。 

MPP 通常 指 具 有 下 列 特点 的 大 规模 的 计算 机 系统 中 处 理 节 点 上 使 用 商品 
化 的 微 处 理 器 ， 且 每 个 节点 上 有 一 个 或 者 多 个 微 处 理 器 ; @ 在 处 理 节 点 上 使 用 物 
理 上 分 布 的 存储 需 ; 色 使 用 高 速 通信 带宽 和 低 延 迟 的 互连网 络 ， 这 些 节 点 间 彼 此 
是 紧 耦 合 的 ; 全 能 扩展 成 具有 成 百 上 千 个 处 理 器 ; @@ 它 是 一 个 异步 多 指令 流 多 数 
据 流 (MIMD) 机 ， 进 程 采用 锁 方 式 进行 消息 传递 操作 。@ 程 序 由 多 个 进程 组 
成 ， 每 个 进程 有 自己 的 私有 地 址 空间 ， 进 程 间 通过 消息 传递 实现 相互 通信 ， 数 据 
分 布 对 于 用 户 不 透明 。 

4) 工作 站 机 群 (CoW) ， 也 称 工 作 站 网 络 (NoW) ， 是 连接 几 个 工作 站 在 一 
起 的 计算 机 网 络 ， 利 用 特殊 的 软件 ， 允 许 被 作为 一 个 集群 来 使 用 这 个 网 络 。 工 作 
站 集群 和 大 规模 并 行 处 理 机 是 很 相似 的 ， 与 大 规模 并 行 处 理 机 相 比 ， 工 作 站 集群 
又 有 以 下 优点 : 中 机 群 的 每 个 节点 都 是 一 个 完整 的 工作 站 ， 一 个 节点 可 以 是 一 台 
PC， 也 可 以 是 一 个 对 称 多 处 理 器 ; 四 各 个 节点 都 采用 低 成 本 的 网 络 相连 接 ; 
机 群 的 每 个 节点 都 有 自己 的 本 地 硬盘 ; 网 节点 内 的 网 络 接口 方式 不 一 样 ， 机 群 
是 松 耦 合 ，MPP 是 紧 耦 合 的 ， 即 它 是 接连 到 IO 总 线 上 而 MPP 直接 接 到 处 理 需 
存储 总 线 上 ; 名 机 群 的 每 个 节点 都 有 一 个 完整 的 操作 系统 ， 像 Berkley NOW 、Al- 
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pha Farm 、Digital Trucluster 等 都 是 工作 站 机 群 。 

5) 分 布 式 共享 存储 处 理 机 (DSM) ， 被 视 为 一 种 分 布 式 全 域 地 址 空间 ( Dis- 
tributed Global Address Space) ，DSM 主要 使 用 在 丛 集 计算 机 中 ， 其 中 每 一 个 网 络 
节点 都 有 非 共 享 的 内 存 空间 和 共享 的 内 存 空 间 ， 后 者 的 位 置 空间 在 所 有 节点 是 一 
致 的 。 


6. 4.3 ”并行 机 的 访 存 模 型 


并 行 机 按照 访 存 模型 可 以 分 为 以 下 五 类 : 

1. 均匀 访 存 模型 ( Uniform Memory Access，UMA) 

在 这 种 访 存 模型 中 ， 所 有 的 物理 存储 器 被 所 有 的 处 理 器 均匀 共享 ， 即 处 理 器 
访问 它们 的 时 间 是 一 样 的 。UMA 中 的 每 台 处 理 器 都 有 自己 的 高 速 缓存 ， 外 围 设 
备 也 能 以 一 定 的 方式 共享 。 这 种 系统 因为 高 度 的 资源 共享 通常 被 称 为 紧 耦 合 系统 
(Tightly Coupled System) 。 对 称 多 处 理 机 (SMP) 采用 的 就 是 均匀 访 存 模型 的 处 
理 模式 。 

2. 非 均匀 访 存 模型 (NUMA) 

在 这 种 访 存 模型 中 ， 被 共享 的 存储 器 物理 上 是 分 布 式 的 ， 所 有 这 些 存储 器 的 
集合 组 成 了 全 局 地 址 空间 ， 所 以 处 理 器 访问 这 些 存储 器 的 时 间 是 不 一 样 的 ， 显 然 
访问 本 地 存储 器 的 速度 要 比 访问 全 局 共享 存储 需 或 远程 访问 外 地 存储 需要 快 些 。 
另外 ，NUMA 中 存储 器 可 能 被 划分 成 不 同 的 层 ， 本 地 存储 器 ， 群 内 共享 存储 器 ， 
全 局 共享 存储 器 。 

3. 全 高 速 缓存 访 存 模型 (COMA) 

该 模型 是 非 均 匀 访 存 模型 (NUMA) 的 一 种 特例 ， 其 中 各 处 理 器 节点 没有 存 
储 层 次 结构 之 分 ， 各 个 处 理 器 所 带 的 高 速 缓存 就 构成 全 局 地 址 空间 。 访 问 方式 是 
利用 分 布 的 高 速 缓存 目录 进行 远程 高 速 缓存 的 访问 。 使 用 全 高 速 缓存 访 存 模型 的 
好 处 是 ， 数 据 在 开始 的 时 候 可 以 任意 分 配 ， 在 运行 时 数据 会 自动 被 迁移 到 要 用 它 
们 的 地 方 。 

4. 一 致 性 高 速 缓存 非 均 匀 存 储 访问 模型 (CC-NUMA) 

该 模型 是 将 一 些 对 称 多 处 理 机 作为 一 个 单 节点 ， 然后 将 这 些 单 节点 连 车 接 起 来 
形成 一 个 较 大 的 系统 ， 它 在 保留 了 对 称 多 处 理 机 的 优点 之 外 ， 还 改善 了 对 称 多 处 
理 机 的 扩展 性 问题 ， 实际 上 是 一 个 分 布 式 共 k 享 存储 处 理 机 (DSM) 多 处 理 机 系 
统 ， 与 全 高 速 缓 存 访问 模型 一 样 ， 数 据 无 需 分 配 ， 在 系统 需要 时 ， 会 自动 调用 自 
己 需 要 的 数据 。 在 商业 使 用 中 ， 大 多 数 访 存 都 在 本 地 存储 器 中 进行 ， 而 网 络 上 传 
输 的 数据 大 多 是 用 于 高 速 缓存 的 无 效 性 。 

5. 非 远 程 存 储 访问 模型 ( NORMA) 

该 模型 最 主要 的 特征 是 在 分 布 式 存 储 系统 中 ， 所 有 的 存储 器 是 完全 私有 的 ， 
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仅 能 由 其 所 属 的 处 理 需 访问 ， 网 络 中 传输 的 数据 是 各 个 节点 间 的 通信 消息 。 
6.4.4 并 行 计算 与 云 计 算 

云 计算 是 分 布 式 处 理 (Distributed Computing) 、 并 行 处 理 (Parallel Compu- 
ting) 和 网 格 计 算 (Grid Computing) 的 发 展 ， 是 通过 网 络 将 庞大 的 计算 处 理 程 
序 自动 分 拆 成 无 数 个 较 小 的 子 程序 ， 再 交 由 多 台 服 务 器 所 组 成 的 庞大 系统 经 计算 
分 析 之 后 将 处 理 结果 回 传 给 用 户 。 通 过 云 计算 技术 ， 网 络 服务 提供 者 可 以 在 数秒 
之 内 ， 处 理 数 以 千 万 计 甚 至 亿 计 的 信息 ， 达 到 与 “超级 计算 机 ”同样 强大 的 网 
络 服务 。 

云 计算 是 在 并 行 计算 之 后 产生 的 概念 ， 是 由 并 行 计算 发 展 而 来 ， 两 者 在 很 多 
方面 有 着 共性 。 学 习 并 行 计算 对 于 理解 云 计 算 有 很 大 的 帮助 。 并 行 计算 是 学 习 云 
计算 必须 要 学 习 的 基础 课程 。 

但 并 行 计算 与 云 计算 并 不 相互 等 同 。 两 者 区 别 如 下 : 

1. 云 计 算 起 源 于 并 行 计 算 

云 计算 的 萌芽 应 该 从 计算 机 的 并 行 化 开始 ， 并 行 机 的 出 现 是 人 们 不 满足 于 
CPU 摩尔 定律 的 增长 速度 ,希望 把 多 个 计算 机 并 联 起 来 ， 从 而 获得 更 快 的 计算 
速度 。 这 是 一 种 很 简单 也 很 朴素 的 实现 高 速 计算 的 方法 ， 这 种 方法 后 来 被 证 明 是 
相当 成 功 的 。 

2. 并 行 计 算 、 网 格 计算 只 用 于 特定 的 科学 领域 

并 行 计算 、 网 格 计算 的 提出 主要 是 为 了 满足 科学 和 技术 领域 的 专业 需要 ， 其 
应 用 领域 也 基本 限于 科学 领域 。 传 统 并 行 计算 机 的 使 用 是 一 个 相当 专业 的 工作 ， 
需要 使 用 者 有 较 高 的 专业 素质 ， 多 数 是 命令 行 的 操作 ， 不 太 适 合 普通 大 众 化 用 户 
的 使 用 。 

3. 并 行 计 算 追 求 的 高 性 能 

在 并 行 计算 的 时 代 ， 人 们 极力 追求 采用 昂贵 的 服务 器 以 实现 高 速 的 计算 ， 各 
国 不 惜 代价 在 计算 速度 上 超越 ， 一 台大 型 机 群 如 果 在 3 年 左右 不 能 得 到 有 效 的 利 
用 就 远 远 落 后 了 ， 巨 额 投资 无 法 收回 。 

4. 云 计 算 对 于 单 节点 的 计算 能 力 要 求 低 

云 计算 时 代 ， 人 们 不 需 去 追求 使 用 昂贵 的 服务 右 ， 云 中 心 的 计算 力 和 存储 力 
可 随 着 需要 逐步 增加 ， 云 计算 的 基础 架构 支持 这 一 动态 增加 的 方式 ,终端 需要 的 
能 力 可 从 云 服务 中 心 获得 满足 。 


6.5 分 布 式 系统 


分 布 式 系统 是 在 集中 式 系统 的 基础 上 发 展 起 来 的 。 但 不 是 简单 地 把 集中 式 企 
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业 数 据 分 散 实 现 ， 它 是 具有 完整 的 性 质 和 特征 的 系统 ， 集 中 式 系统 的 许多 概念 和 
技术 ， 如 企业 数据 的 完整 性 、 独 立 性 、 数 据 共 享 、 减 少 元 余 度 、 并 发 控制 、 安 全 
性 和 恢复 等 在 分 布 式 系统 中 都 有 了 不 同 之 处 及 更 加 丰富 的 内 涵 。 


6. 5.1 分 布 式 系统 概述 


分 布 式 系统 有 很 多 不 同 的 定义 ,但 其 中 没有 精确 的 或 者 能 够 被 所 有 人 接受 的 
定义 。 下 述 定 义 能 够 清晰 地 描述 出 分 布 式 系统 的 特点 :“ 一 个 分 布 式 系 统 是 一 些 
独立 的 计算 机 的 集合 ， 但 对 于 使 用 这 些 系统 的 用 户 来 说 ， 系 统 就 像 一 台 计 算 机 一 
样 "。 这 个 定义 包含 了 两 层 含 义 : 第 一 ， 从 硬件 的 角度 讲 ， 各 个 计算 机 都 是 自治 
的 ; 第 二 ， 从 软件 的 角度 来 讲 ， 用 户 将 整个 系统 看 作 是 一 台 计 算 机 。 

分 布 式 系统 是 建立 在 网 络 之 上 的 软件 系统 ， 所 以 又 称 为 分 布 式 软件 系统 
(Distributed Software Systems ，DSS ) 。DSS 是 支持 分 布 式 处 理 的 软件 系统 ， 是 在 
由 通信 网 络 互联 的 多 处 理 机 体系 结构 上 执行 任务 的 系统 。 它 包括 分 布 式 操作 系 
统 、 分 布 式 程序 设计 语言 及 其 编译 系统 、 分 布 式 文件 系统 和 分 布 式 数据 库 系 
统 等 。 

分 布 式 操作 系统 ， 负 责 管理 分 布 式 处理 系 统 资源 和 控制 分 布 式 程序 运行 。 它 
与 集中 式 操作 系统 的 区 别 在 于 资源 管理 、 进 程 通信 和 系统 结构 等 方面 。 

分 布 式 程序 设计 语言 ， 用 于 编写 运行 于 分 布 式 计 算 机 系统 上 的 分 布 式 程序 。 
一 个 分 布 式 程序 由 若干 个 可 以 独立 执行 的 程序 模块 组 成 ， 它 们 在 一 个 分 布 式 处 理 
系统 的 多 台 计 算 机 上 被 同时 执行 。 它 与 集中 式 的 程序 设计 语言 相 比 有 三 个 特点 : 
分 布 性 、 通 信 性 和 稳健 性 。 

分 布 式 文件 系统 ， 具 有 执行 远程 文件 存 取 的 能 力 ， 并 以 透明 方式 对 分 布 在 网 
络 上 的 文件 进行 管理 和 存 取 。 

分 布 式 数据 库 系 统 ， 由 分 布 于 多 个 计算 机 节点 上 的 若干 个 数据 库 系 统 组 成 ， 
它 提供 有 效 的 存 取 手段 来 操纵 这 些 节点 上 的 子 数据 库 。 分 布 式 数据 库 在 使 用 上 可 
视 为 一 个 完整 的 数据 库 ， 而 实际 上 它 是 分 布 在 地 理 分 散 的 各 个 节点 上 。 当 然 , 分 
布 在 各 个 节点 上 的 子 数据 库 在 逻辑 上 是 相关 的 。 

在 一 个 分 布 式 系统 中 ， 通 常 由 若干 个 独立 的 计算 机 组 成 ， 但 对 用 户 来 说 就 像 
一 台 计 算 机 一 样 。 系 统 拥 有 多 种 通用 的 物理 和 逻辑 资源 ， 可 以 动态 地 分 配 任务 ， 
分 散 的 物理 和 逻辑 资源 通过 计算 机 网 络 实现 信息 交换 。 系 统 中 存在 一 个 以 全 局 的 
方式 管理 计算 机 资源 的 分 布 式 操作 系统 。 


6. 5.2 分 布 式 系统 和 计算 机 网 络 系统 


分 布 式 系统 和 计算 机 网 络 系统 的 共同 点 是 : 多 数 分 布 式 系统 是 建立 在 计算 机 
网 络 之 上 的 ， 所 以 分 布 式 系统 与 计算 机 网 络 在 物理 结构 上 是 基本 相同 的 。 
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区 别 在 于 : 分 布 式 操作 系统 的 设计 思想 与 网 络 操作 系统 是 不 同 的 ， 这 决定 了 
它们 在 结构 、 工 作 方式 和 功能 上 也 不 同 。 网 络 操作 系统 要 求 网 络 用 户 在 使 用 网 络 
资源 时 首先 必须 了 解 网 络 资源 ， 网 络 用 户 必须 知道 网 络 中 各 个 计算 机 的 功能 与 配 
置 、 软 件 资源 、 网 络 文件 结构 等 情况 ， 在 网 络 中 如 果 用 户 要 读 一 个 共享 文件 时 ， 
用 户 必 须知 道 这 个 文件 放 在 哪 一 人 台 计 算 机 的 哪 一 个 目录 下 ; 分 布 式 操作 系统 是 以 
全 局 方式 管理 系统 资源 的 ， 它 可 以 为 用 户 任意 调度 网 络 资源 ， 并 且 调 度 过 程 是 
“透明 ”的 。 当 用 户 提交 一 个 作业 时 ， 分 布 式 操作 系统 能 够 根据 需要 在 系统 中 选 
择 最 合适 的 处 理 顺 ， 将 用 户 的 作业 提交 到 该 处 理 程序 ， 在 处 理 咒 完成 作业 后 ， 将 
结果 传 给 用 户 。 在 这 个 过 程 中 ,用 户 并 不 会 意识 到 有 多 个 处 理 器 的 存在 ， 这 个 系 
统 就 像 是 一 个 处 理 絮 一 样 。 


6. 5.3 分 布 式 系统 的 特性 


从 使 用 分 布 式 系统 的 用 户 所 关心 的 主要 问题 出 发 ， 分 布 式 系统 应 具有 以 下 几 
个 重要 特征 : 

1. 数据 独立 性 与 透明 性 

在 分 布 式 系统 中 ， 数 据 独 立 性 这 一 特性 比 集 中 式 更 加 重要 ， 并 具有 更 多 的 内 
容 。 除 了 数据 的 逻辑 独立 性 与 物理 独立 性 之 外 ， 还 有 数据 分 布 独立 性 ， 即 透明 
性 。 分 布 透 明 性 指 用 户 的 应 用 程序 可 以 独立 于 数据 而 存在 ， 用 户 不 必 关 心 数据 的 
物理 位 置 的 细节 ， 也 不 必 关 心 重复 副本 〈 宛 余数 据 ) 的 一 致 性 问题 。 

2. 数据 一 致 性 

分 布 式 系统 具有 硬件 设备 分 布 式 零散 性 的 特点 ， 内 部 数据 的 一 致 性 也 是 非常 
重要 的 。 数 据 的 时 效 性 也 是 分 布 式 系统 设计 中 需要 解决 的 一 个 难题 。 对 于 海量 数 
据 和 跨 地 域 数据 同步 来 说 ， 则 更 加 困难 。 首 先 ， 要 保证 数据 同步 的 正确 性 ; 其 
次 ， 需 要 保证 数据 同步 的 高 效 性 ， 即 在 足够 短 的 延 时 中 完成 数据 同步 。 由 于 分 布 
式 系 统 可 能 存在 地 域 分 散 的 特点 ， 区 域 间 的 固定 延 时 (RTT) 将 是 分 布 式 系统 设 
计 的 一 个 难题 。 

3. 集中 与 自治 相 结 合 的 控制 结构 

企业 数据 是 用 户 的 共享 资源 ， 在 集中 系统 中 ,为 了 保证 数据 的 完整 性 和 可 靠 
性 ， 对 共享 数据 的 控制 是 集中 的 ， 并 设 有 DBA (数据 库 管理 员 ) 负责 监督 和 维 
护 系 统 的 运行 。 在 分 布 式 系统 中 ， 数 据 共 享有 两 个 层次 ， 一 是 局 部 信息 共享 ， 即 
在 局 部 数据 库 中 存在 局 部 场地 上 的 各 用 户 的 共享 数据 ， 二 是 全 局 共享 ， 即 在 分 布 
式 系 统 中 也 存储 可 供 其 他 用 户 共 享 的 数据 ， 支 持 系统 的 全 局 应 用 。 分 布 式 系 统 常 
常 采用 集中 和 自治 相 结合 的 控制 结构 。 

4. 高 并 发 性 

高 并 发 性 指 系统 在 单位 时 间 内 能 同时 接受 和 处 理 的 请 求 数量 。 高 并 发 性 也 是 
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分 布 式 系统 的 一 个 基本 要 求 。 然 而 ， 承 载 着 不 同 应 用 的 不 同 分 布 式 系统 ， 对 于 并 
发 设计 的 要 求 也 是 有 很 大 差异 的 。 一 般 来 说 分 为 两 种 情况 . 一 种 情况 ， 需 要 对 会 
话 过 程 进行 保持 ， 即 当 用 户 与 分 布 式 系统 的 连接 断 开 以 后 ， 需 要 重新 连 回 到 分 布 
式 系统 内 部 原来 分 配给 用 户 提供 服务 的 设备 上 ; 另 一 种 ， 不 需要 对 会 话 过 程 进行 
保持 ， 也 就 是 说 ， 用 户 与 分 布 式 系统 内 部 的 某 一 物理 设备 连接 断 开 后 ， 重 新 连接 
到 分 布 式 系统 内 部 的 任意 物理 设备 也 能 提供 正确 的 服务 。 

一 般 来 说 ， 解 决 高 并 发 问题 ， 核 心 的 设计 是 负载 均衡 。 在 某 一 个 时 刻 ， 单 一 
物理 设备 的 处 理 能 力 是 有 限 的 。 将 用 户 流量 、 用 户 的 并 发 请 求 合 理 地 分 配 到 更 多 
的 物理 设备 上 ， 是 解决 高 并 发 问题 的 基本 方法 。 负 和 载 均衡 算法 (有 很 多 种 ) 往 
往 也 是 分 布 式 系统 测试 的 核心 内 容 。 

5. 高 可 扩展 性 

一 般 来 说 ， 分 布 式 系统 要 求 能 承载 海量 的 数据 ， 而 且 要 求 运 行 相当 长 的 时 
间 ， 而 物理 设备 的 空间 、 容 量 和 性 能 是 一 定 的 。 随 着 用 户 数据 量 的 不 断 增 长 ， 系 
统 运 行 了 一 段 时 间 以 后 ， 往 往 会 受到 物理 设备 的 局 限 ， 一 般 来 说 ， 架 构 设 计 合理 
的 分 布 式 系统 ， 是 可 以 通过 增加 物理 设备 以 实现 增加 系统 服务 能 力 的 ， 例 如 用 户 
并 发 量 、 系 统 数据 吞吐 量 、 系 统 数 据 总 容量 等 ， 系 统 的 规模 和 处 理 能 力 能 够 在 线 
扩容 。 

总 之 ,分 布 式 系统 可 以 解决 组 织 机 构 分 散 而 数据 需要 相互 联系 的 问题 。 
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在 实践 中 ， 人 们 总 结 出 了 一 些 常用 软件 系统 部 署 的 高 层 模型 ， 以 供应 用 系统 
设计 时 参考 。ECM 系统 是 典型 的 软件 系统 结构 ， 它 所 涉及 的 部 署 模式 也 包括 下 
列 几 种 : 单 服务 集中 式 系统 、 两 层 / 多 层 、 三 层 B/S 结构 、 分 布 式 系统 等 。 


7.2 集中 式 系统 


集中 式 部 署 是 一 种 基于 网 络 的 集中 式 计 算 模式 。 这 一 计算 体系 中 所 有 软件 的 
和 运行、 配置、 调度 、 通 信 、 数 据 存储 等 都 在 服务 器 上 完成 ， 客 户 端 只 作为 输入 、 
输出 、 显 示 的 设备 。 集 中 式 部 署 时 ， 所 有 的 ECM 功能 运行 在 一 台 物 理 机 带 上 ， 
在 提供 服务 时 不 与 其 他 计算 机 交互 。 在 服务 用 户 时 ， 该 应 用 可 以 是 多 进程 或 多 线 
程 的 。 现 代 通 用 的 计算 机 系统 包括 一 到 多 个 CPU 以 及 若干 个 设备 控制 器 ， 通 过 
公共 总 线 连接 在 一 起 并 提供 对 共享 内 存 的 访问 。CPU 具有 本 地 的 高 速 缓冲 存储 
器 ， 用 于 存放 主 存储 器 中 部 分 数据 的 本 地 副本 ， 从 而 加 快 对 数据 的 访问 。 每 个 设 
备 控制 器 负责 一 种 类 型 的 设备 。CPU 和 设备 控制 器 可 以 并 行 地 工作 ， 它 们 竞争 
对 于 主 存储 器 的 访问 。 高 速 缓存 存储 器 减少 了 CPU 需要 访问 的 共享 内 存 次 数 ， 
从 而 减少 了 对 主 存储 器 访问 的 竞争 。 

使 用 集中 模式 服务 需 的 方式 有 两 种 ， 单 用 户 系 统 和 多 用 户 系统 。 个 人 计算 机 
和 工作 站 属于 第 一 类 ， 典 型 的 单 用 户 系统 是 个 人 桌面 系统 。 单 用 户 系 统 通常 只 有 
一 个 CPU 和 一 至 两 个 硬盘 ， 而 且 一 次 只 有 一 个 用 户 使 用 该 服务 咒 。 一 个 多 用 户 
系统 通常 有 多 个 硬盘 和 多 个 存储 顺 ， 可 能 具有 多 个 CPU， 并 且 有 一 个 多 用 户 操 
作 系 统 ， 它 为 大 量 的 通过 终端 与 系统 连接 的 用 户 服 务 。 在 规模 小 的 企业 中 ， 大 部 
分 软件 系统 其 实 都 可 以 通过 集中 式 部 署 来 实现 。 集 中 式 部 署 允 许 用 户 通过 C/S 
和 B/S 模式 访问 内 容 服 务 咒 来 实现 对 内 容 的 操作 。 

集中 式 系统 的 优点 如 下 : 

1) 部 署 简单 ， 不 需要 修改 现 有 的 应 用 程序 ， 不 改变 原 有 的 网 络 结构 ， 服 务 
器 的 程序 和 应 用 软件 的 安装 调试 非常 方便 。 管 理 员 只 需要 维护 服务 器 上 的 应 用 程 
序 ， 为 每 个 用 户 和 用 户 组 配置 好 系统 和 应 用 即 可 ， 终 端 用 户 不 必 进行 任 何 安装 调 
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试 工作 。 

2) 系统 安全 性 强 ， 可 以 通过 设 定 ， 使 得 客户 端 没有 办 法 上 传 数据 ,保证 系 
统 不 受 病毒 的 侵害 ; 不 能 下 载 数据 ， 保 证 不 会 使 资料 被 复制 流失 而 泄密 ， 这 样 就 
能 有 效 避 免 来 自 客 户 端的 病毒 ， 并 防止 非法 复制 软件 和 数据 。 

3) 数据 安全 性 强 ， 可 采用 用 户 认证 方式 ， 使 用 标准 的 高 强度 安全 协议 传输 
数据 ， 另 外 网 络 传输 的 不 是 真正 的 业务 数据 ， 而 是 经 压缩 和 加 密 后 的 屏幕 变化 数 
据 ， 同 时 还 提供 了 对 远程 访问 的 实时 监控 和 审计 。 

4) 应 用 高 速度 ， 由 于 采用 服务 器 计算 模式 ， 网 络 只 传输 键盘 信息 、 鼠 标点 
击 和 屏幕 更 新 信息 ， 这 样 大 大 降低 对 带宽 的 需求 ， 使 得 即便 是 56kbit/s 这 样 的 罕 
带 网 络 都 可 以 正常 使 用 。 

集中 式 系统 的 关键 问题 在 于 其 性 能 及 可 靠 性 ， 当 大 量 并 发 用 户 使 用 时 性 外 
法 保证 ， 服 务 器 出 现 故 障 时 系统 将 无 法 提供 可 靠 服 务 。 











7.3 双 机 热 备 


7.3.1 双 机 热 备 综述 


双 机 热 备 特 指 基 于 高 可 用 系统 中 的 两 台 服 务 器 的 热 备 ， 因 两 机 高 可 用 使 用 较 
多 ， 故 得 名 双 机 热 备 。 双 机 高 可 用 按 工 作 中 的 切换 方式 分 为 主 - 备 方式 ( Active- 
Standby 方式 ) 和 双 主 机 方式 (Active- Active 方式 ) 。 主 - 备 方式 是 指 一 台 服 务 器 
处 于 某 种 业务 的 激活 状态 ( 即 Active 状态 ) ， 另 一 台 服 务 器 处 于 该 业务 的 备用 状 
态 ( 即 Standby 状态 ) 。 而 双 主 机 方式 是 指 两 种 不 同业 务 分 别 在 两 侣 服务 器 上 互 
为 主 备 状态 。 


7.3.2 双 机 热 备 的 实现 方案 


双 机 热 备 的 实现 方案 主要 有 三 种 方式 ; 基于 共享 存储 〈 磁 阵列 ) 的 方式 ， 
全 宛 余 〈 双 机 双 存 储 ) 方式 和 基于 数据 复 
和 
. 共享 存储 方式 
过 磁盘 阵列 提供 
切换 ， 对 数据 完整 性 和 连续 性 进行 保障 。 
用 户 数据 一 般 会 放 在 磁盘 阵列 上 ， 当 主机 
宕 机 后 ， 备 机 继续 从 磁盘 阵列 上 取得 原 有 
数据 ， 如 图 7-1 所 示 。 
这 种 方式 因为 使 用 一 台 存 储 设备 ， 存 图 7-1 传统 的 单 存储 方式 
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在 磁盘 单 点 故障 风险 ， 但 这 种 存储 系统 的 安全 性 较 高 。 所 以 如 果 忽 略 存储 设备 故 
障 的 情况 下 ， 这 种 方式 也 是 业内 采用 最 多 的 热 备 方式 。 

2. 全 元 余 方式 

基于 单 台 系统 的 双 机 热 备 方式 ， 确 实 存在 单 点 故障 的 情况 。 为 实现 系统 的 高 
可 用 性 ,， 双 机 热 备 应 用 越 来 越 多 ， 尤 其 随 着 技术 的 进步 ， 进 入 到 了 没有 单 点 故障 
的 全 宛 余 双 机 热 备 方式 ， 如 图 7-2 所 示 。 

在 这 种 方式 中 ， 存 储 之 间 的 数据 复制 不 经 
过 网 络 ， 而 是 在 存储 设备 之 间 进 行 复制 ， 两 个 
存储 之 间 的 复制 是 完全 实时 的 ， 主 备 存储 之 间 
的 切换 时 间 小 于 500ms ， 以 确保 系统 存储 时 不 产 
生 延 时 ， 硬 盘 盘 符 及 分 区 不 因为 主 备 存储 之 间 
的 切换 而 改变 ， 这 样 ， 服 务 器 的 切换 不 影响 存 
储 之 间 的 初始 化 、 增 量 同 步 及 数据 复制 ， 当 某 ”图 7-? 全 元 余 双 机 热 备 方式 
一 存储 设备 做 计划 性 停机 时 ， 不 影响 整个 双 机 
热 备 系统 的 工作 ， 存 储 设备 之 间 增 量 同步 工作 ， 使 用 重复 数据 删除 技术 来 完成 ， 
因此 ， 这 是 一 个 真正 的 7 x24 小 时 全 宛 余 方案 。 

3. 基于 数据 复制 方式 

这 种 方式 主要 利用 数据 的 同步 方式 ， 保 证 主 / 备 服务 器 的 数据 一 致 性 。 基 于 
数据 复制 的 方式 有 多 种 方法 ， 其 性 能 和 安全 也 不 尽 相 同 。 其 中 主要 方法 有 以 下 
几 种 ; 

1) 单纯 的 文件 复制 方式 。 该 方式 主要 在 Web 页 的 更 新 、FTP 上 传 、 对 主 备 
机 数据 完整 性 、 连 续 性 要 求 不 高 的 情况 下 使 用 。 该 方式 不 适用 于 数据 库 系 统 等 应 
用 ， 因 为 打开 的 文件 是 不 能 被 复制 的 ， 如 果 要 复制 必须 将 数据 库 关 闭 ， 这 显然 不 
能 满足 要 求 。 

2) 利用 数据 库 自 带 的 复制 功能 ， 比 如 SQL Server 的 订阅 复制 ， 这 种 方式 用 
户 要 根据 自己 的 应 用 小 心 使 用 ， 原 因 是 : GD SQL Server 的 订阅 复制 会 在 用 户 表 上 
增加 字段 ， 对 应 用 软件 编程 要 求 较 高 ， 如 果 在 应 用 软件 端 书写 时 未 明确 指定 字段 
的 用 户 ， 使 用 此 功能 会 造成 应 用 程序 无 法 正常 工作 。@ 数 据 滞留 ， 这 个 限制 也 特 
别 关键 ， 因 为 SQL Server 在 数据 传输 过 程 中 数据 并 非 实时 地 到 达 主 备 机 ， 而 是 数 
据 先 写 到 主机 ， 再 写 到 备 机 ， 如 此 一 来 ， 备 机 的 数据 往往 来 不 及 更 新 ， 此 时 如 果 
发 生 切 换 ， 备 机 的 数据 将 不 完整 也 不 连续 ， 如 果 用 户 发 现 已 写 人 的 数据 在 备 机 中 
找 不 到 ， 重 新 写 和 人 的话 ， 则 主机 修复 后 ， 就 会 发 生 主 备 机 数据 严重 冲突 ， 数 据 库 
会 变 得 混乱 。@ 复 杂 应 用 不 要 使 用 订阅 复制 来 做 双 机 热 备 ， 包 括 数据 结构 中 存储 
过 程 的 处 理 ， 触 发 器 和 序列 一 旦 发 生 冲 突 ， 修 改 起 来 非常 麻烦 。@ 服 务 器 性 能 降 
低 ， 对 于 大 规模 的 数据 库 ，SQL Server 的 订阅 复制 会 造成 服务 器 数据 库 运行 绥 
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慢 。 总 之 ，SQL Server 的 订阅 复制 主要 应 用 于 数据 快照 服务 ， 不 能 用 来 做 双 机 热 
备 中 的 数据 同步 。 

3) 硬盘 数据 拦截 ， 是 目前 国内 外 比较 成 熟 的 双 机 热 备 软件 技术 ， 通 党 称 为 
镜像 (Mirror) 软件 ， 这 种 技术 已 非常 成 熟 ， 主 要 的 拦截 技术 有 : 中 分 区 拦截 ， 
以 Plus well 热 备份 产品 为 例 ， 它 采用 一 种 分 区 人 硬盘 扇 区 拦截 的 技术 ,通过 驱动 
级 的 拦截 方式 ， 将 数据 写 往 硬 盘 的 数据 提取 ， 并 首先 写 到 备用 服务 器 ， 以 保证 备 
用 服务 咒 的 数据 最 新 ， 然 后 再 将 数据 回 写 到 主机 。 这 种 方式 将 完全 保证 主 备 机 数 
据 库 的 数据 完全 一 致 ， 无 论 发 生 哪 种 切换 ， 都 能 保证 数据 库 的 完整 性 与 连续 性 。 
由 于 采用 分 区 拦截 技术 ， 所 以 用 户 可 以 根据 需要 在 一 块 硬盘 上 划分 适合 大 小 的 分 
区 来 完成 数据 同步 工作 。 包 硬盘 拦截 技术 ， 以 Symantece 的 Co-Standby 为 例 ， 其 
拦截 主要 基于 一 整 块 硬盘 ， 往 往 在 硬盘 初始 化 时 需要 消耗 大 量 的 时 间 。 


7.3.3 双 机 热 备 产品 


目前 国外 主要 的 双 机 热 备 产品 : 微软 MSCS ，Symantec VCS，Legato，NEC 
Express Cluster，LifeKeeper，EMC Anutostart， 红 帽 RHCS。 国 内 的 产品 : ROSE ， 
Pluswell 集群 软件 ，Lander Cluster 集群 软件 ，EterneCluster 集群 软件 。 


7.3.4 Pluswell 容错 软件 技术 简介 及 其 应 用 


1，Pluswell 容错 软件 原理 

Pluswell 容错 软件 提供 了 一 个 完全 容错 的 软件 解决 方案 ， 并 提供 数据 、 应 用 
和 通信 资源 的 高 度 可 用 性 。 该 软件 不 需要 任何 特别 的 容错 硬件 ， 可 访问 特定 节点 
的 配置 数据 ， 并 自动 提供 错误 检测 和 现场 恢复 。 

在 出 现 故障 的 情况 下 ，Pluswell 会 将 被 保护 的 资源 自动 转 到 一 个 根据 预先 设 
定好 的 优先 权 系统 。 在 实际 进行 切换 用 户 时 ， 会 经 历 一 个 十 分 短暂 的 休眠 。 但 
是 ， 当 系统 完成 了 切换 操作 后 ，Pluswell 容错 软件 会 在 所 选择 的 节点 上 自动 地 恢 
复 操作 。 

可 以 被 Pluswell 容错 软件 保护 起 来 的 资源 有 : 卷 、IP 地 址 、 共 享 文件 、 管 理 
器 服务 器 名 称 、 应 用 程序 、 定 义 的 用 户 。 

2. 心跳 故障 检测 (Heartbeat) 

Pluswell 容错 软件 在 集群 节点 间 保 持 着 间歇 的 通信 信号 ， 即 心跳 信号 ， 这 是 
错误 检测 的 一 个 机 制 ， 即 通过 每 一 个 通信 路 径 ， 在 两 个 对 等 系统 之 间 进 行 周期 性 
地 握手 ， 如 果 连 续 没 有 收 到 的 心跳 信号 到 了 一 定数 目 ，Pluswell 软件 就 把 这 条 
径 标示 为 失效 。 如 果 定 义 了 一 条 通信 路 径 ， 当 Pluswell 软件 把 唯一 的 一 条 通信 路 
径 标示 为 失效 时 ， 就 立即 开始 恢复 过 程 。 但 是 ， 如 果 有 和 宛 余 路 径 ，Pluswell 容错 
软件 能 够 通过 第 二 条 路 径 确 定 是 系统 故障 还 是 通信 路 径 有 问题 。 如 果 Pluswell 软 












































第 7 章 企业 内 容 管 理 系 统 的 部 署 “ 121.: 





件 开启 优先 级 的 通信 路 径 收 到 了 心跳 信号 ， 就 不 会 开始 Failover 恢复 ， 只 需要 把 
第 一 条 通信 路 径 标 成 失效 颜色 ， 通 知 应 用 需要 修复 故障 路 径 。 

一 般 情况 下 ，Pluswell 容错 软件 只 在 发 生 下 列 事件 时 启动 系统 恢复 功能 : 所 
有 的 通信 路 径 故 障 、 如 果 所 有 节点 都 没收 到 心跳 信号 、 把 所 有 通信 路 径 都 标示 为 
失效 ，Pluswell 软件 才 开 始 安 全 检查 。 

安全 检查 失败 。 当 所 有 通信 和 路径 故障 时 ，Pluswell 容错 软件 向 整个 网 络 发 出 
安全 检查 信号 ， 如 果 信 和 号 指出 配对 系统 还 “ 活 ” 着 的 时 候 ，Pluswell 软件 不 启动 
Failove， 如 果 安 全 检查 没有 从 配对 节点 返回 信号 ，Pluswell 容错 软件 就 开始 
Failover。 

因此 ， 在 使 用 Pluswell 容错 软件 时 ， 为 了 减少 潜在 的 通信 和 错误 所 引起 的 不 必 
要 的 系统 切换 ， 建 议 使 用 不 同 介质 的 多 条 通信 路 径 。 

3. 通信 路径 种 类 

Pluswell 容错 软件 使 用 如 下 的 通信 路 径 : 

1) Socket 套 接 字 ， 使 用 任何 支持 TCP/P 通信 协议 网 络 硬件 接口 。 

2) 串 行 口 ,在 Pluswell 容错 软件 配置 中 ,应 当 配 置 一 个 串 行 口 通信 路 径 ， 
该 路 径 需 要 利用 RS232 的 模拟 调解 线路 来 与 Pluswell 软件 系统 相连 接 。 

Pluswell 容错 软件 假定 当 通 过 心跳 信号 检测 其 他 服务 失败 时 ， 则 认为 此 服务 
器 是 关闭 的 。 因 此 ， 为 了 避免 不 必要 的 失效 切换 ， 最 好 建立 两 种 以 上 独立 的 物理 
路 径 ， 使 用 至 少 两 种 心跳 。 节 点 间 的 多 种 通信 路 径 可 以 帮助 避免 不 必要 的 失效 
切换 。 

4. Pluswell 容错 软件 配置 示例 ( 见 图 7-3 ) 

(1) 软件 、 硬 件 配置 

软件 : Pluswell Cluster 容错 软件 。 服务 器 1 

硬件 : 服务 器 可 以 是 任何 Intel 基础 上 
的 平台 ， 服 务 器 的 型 号 、 配 置 不 必 一 致 ， 只 
需 硬 件 平台 能 保证 Windows NT/2000/Linux/ 
UNIX 运行 、 磁 盘 阵 列 正常 使 用 。 

(2) Pluswell Cluster 容错 软件 运行 机 制 











磁盘 阵列 

















本 
1) 共享 的 SCSI 和 Pluswell Cluster 容错 一 人 
软件 锁定 。 图 7-3 Pluswell 容错 软件 配置 图 








Pluswell Cluster 容错 软件 锁定 : Pluswell 
Cluster 容错 软件 管理 共享 磁盘 上 的 数据 ， 防 止 多 个 服务 器 在 同一 时 间 访 问 数据 。 
Pluswell Cluster 容错 软件 在 逻辑 设备 级 〈 卷 ) 上 控制 对 数据 的 访问 ， 并 人 允许 Win- 
dows/ Linux 软件 或 硬件 RAID Controllers 管理 物理 级 。 有 了 Pluswell Cluster 容错 
软件 来 管理 对 共享 数据 的 访问 ， 用 户 就 可 以 不 必 担 心 群 中 的 其 他 服务 器 访问 数据 
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时 ， 可 能 会 带 来 的 数据 访问 冲突 。Pluswell Cluster 容错 软件 自动 在 被 应 用 程序 定 
义 为 共享 资源 的 磁盘 卷 上 设置 锁定 。 当 被 保护 的 应 用 程序 由 一 个 服务 器 被 移动 到 
另 一 个 服务 器 时 ，Pluswell Cluster 容错 软件 控制 这 些 锁定 ， 以 保证 激活 服务 器 对 
共享 卷 的 访问 。 在 主 系统 发 生 故 障 的 情况 下 ， 次 节点 系统 将 能 够 在 磁盘 上 建立 
SCSI (小 型 计算 机 系统 接口 ) 锁定 ， 并 在 备份 的 系统 上 将 资源 投入 使 用 。 

2) Local Recovery (局 部 恢复 ) 。 

Pluswell Cluster 容错 软件 在 应 用 软件 的 检测 时 间 间 隔 执行 预先 定义 的 行为 ， 
以 查看 资源 本 身 是 否 失效 。 如 果 快 速 检 查 和 深入 检查 均 告 失败 时 ， 系 统 将 尝试 局 
部 恢复 资源 。 如 果 尝 试 成 功 ， 资 源 将 不 会 向 下 一 优先 级 的 节点 进行 失效 切换 
( Failover) 。 如 果 局 部 恢复 尝试 失败 ， 系 统 将 向 下 一 优先 级 的 节点 进行 失效 切换 。 

3) Failover (失效 切换 ) 。 

指定 主要 的 节点 或 资源 失败 时 ， 重 新 恢复 资源 的 过 程 。 一 个 失效 切换 通常 是 
没有 事先 计划 的 ， 它 将 发 生 在 一 个 被 从 属 系统 所 检测 到 并 确定 为 失败 的 情况 下 。 

4) Switchback (可 配置 的 迁 回 ) 。 

Configurable Switchback (CS) 允许 Pluswell Cluster 容错 软件 管理 员 通 过 命令 
行 或 GUI (图 形 用 户 界面 ) 来 指定 资源 ， 其 所 在 服务 器 发 生 故 障 而 后 又 恢复 正 
常 ， 该 资源 将 被 自动 地 切换 回 到 原来 的 节点 上 。 如 果 选 择 Auto Switchback ， 则 一 
且 发 生 故 障 的 节点 回 到 服务 状态 时 ， 被 配置 失效 切换 的 层次 都 将 被 切 回 到 该 节点 
上 。 如 果 策 略 没有 选 定 Auto Switchback， 即 使 当 发 生 故 障 的 节点 回 到 服务 状态 
时 ， 被 配置 失效 切换 的 层次 也 会 留 在 它们 被 失效 切换 到 的 节点 上 ， 等 待 由 管理 员 
决定 合适 的 时 间 进 行 切换 。 

5) Switchover (正常 切换 ) 。 

间 用 一 个 有 顺序 的 方式 关闭 资源 ， 然 后 将 它们 恢复 到 一 个 备份 系统 的 过 
程 。 这 通常 发 生 在 处 于 维护 或 者 测试 模式 中 的 情况 下 。 这 时 ， 没 有 任何 东西 
失败 。 

(3) 工作 方式 

1) Active/Stand 方式 ， 如 图 7-4 所 示 。 
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图 7-4 Active/Stand 方式 
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在 一 个 激活 /备用 对 中 ， 主 节点 处 于 处 理 状 态 ， 从 属 节点 处 于 备用 状态 ， 以 
防 主 节 点 上 发 生 失 败 。 备 用 系统 可 以 采用 小 一 点 、 人 性 能 低 一 点 的 系统 ,但 是 ， 当 
主 节 点 失败 时 ， 它 必须 有 保证 资源 可 达 性 的 处 理 能 力 。 

2) Active/ Active 方式 ， 如 图 7-5 所 示 。 
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图 7-5 ”Active/Active 方式 


在 一 个 激活 /激活 对 中 , 两 个 节点 都 是 激活 的 处 理 器 ， 但 是 它们 也 可 分 别 作 
为 其 对 应 节点 上 的 资源 和 资源 层次 的 从 属 节点 。 

在 激活 /激活 的 图 表 中 ， 有 两 个 主要 应 用 : APPA 处 于 Volume W 中 ， 并 且 在 
服务 器 1 上 激活 。APPB 存储 在 Volume M 上 ,并且 在 服务 器 2 上 激活 。 在 这 一 配 
置 中 ， 服 务 器 1 应 该 是 Volume W: 资源 的 主 节 点 ， 服 务 器 2 应 该 是 Volume M : 
资源 的 从 节点 。 

当 服务 需 2 失败 时 , Pluswell Cluster 容错 软件 应 该 将 Volume M 转换 到 服务 器 
1 上 去 。 如 果 系 统 资源 足够 ， 这 一 转换 不 会 影响 到 已 经 在 服务 器 1 上 运行 的 AP- 
PA ， 转 换 只 是 简单 地 将 服务 器 2 上 的 被 保护 应 用 程序 (APPB) 加 到 服务 器 1 的 
运行 负载 上 。 


7.4 集群 模式 


对 于 服务 器 而 言 ， 单 纯 地 提高 单个 处 理 器 的 运算 能 力 和 处 理 能 力 正在 变 得 越 
来 越 难 ， 研 发 多 个 CPU 的 并 行 处 理 技术 才 是 真正 提高 服务 器 处 理 能 力 和 运算 速 
度 的 有 效 途径 。 目 前 ， 业 界 比 较 关 注 的 并 行 处 理 技术 主要 有 SMP 技术 、MPP 技 
术 、COMA 技术 、 集 群 技术 和 NUMA 技术 等 。 

高 端 计 算 体 系 结构 的 发 展 遵循 “分 而 治之 ”的 规律 。 从 金融 、 电 信 、 互 联网 
等 大 型 行业 的 数据 集中 处 理 到 分 布 计 算 处 理 ， 再 到 二 次 集中 和 海量 计算 ， 发 展 趋 
势 和 应 用 都 一 直 处 在 变化 当中 。 作 为 技术 本 身 ， 分 区 和 集群 技术 正 是 为 适应 不 断 
变化 的 需要 而 产生 的 。 随 着 企业 内 容 管理 系统 规模 的 扩大 ， 需 求 和 应 用 的 变化 更 
加 频繁 ， 因 此 复杂 的 管理 体系 结构 发 展 必 然 顺 应 这 一 需求 变化 趋势 。 集 群 技术 可 
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以 有 效 地 解决 开放 系统 的 稳定 、 抗 压 和 负载 均衡 问题 。 
7.4.1 集群 技术 综述 


集群 技术 是 一 种 计算 机 系统 之 间 连 接 的 方式 ， 运 用 它 可 以 将 分 散 的 计算 机 系 
统 连接 起 来 ， 完 成 原来 独立 节点 系统 无 法 完成 的 任务 ， 最早 的 集群 系统 就 是 出 于 
这 样 的 并 行 处 理 的 目的 出 现 的 。 但 是 随 着 计算 机 性 能 的 发 展 和 网 络 不 安全 因素 的 
出 现 ， 系统 的 稳定 性 和 可 靠 性 是 行业 面临 的 主要 问题 。 开 始 使 用 集群 方式 将 两 台 
以 上 的 设备 连接 起 来 ， 当 整个 集群 系统 中 发 生 单 点 或 者 局 部 多 点 故障 时 ， 集 群 中 
其 他 的 计算 机 将 自动 来 接替 出 故障 的 设备 。 最 典型 的 例子 就 是 双 机 热 备 份 系统 。 
两 合 一 样 的 计算 机 系统 使 用 集群 软件 连接 起 来 ， 其 中 一 台 作 为 为 一 台 的 备份 ， 当 
主机 系统 前 溃 时 ， 另 一 台 来 接替 它 的 任务 。 除 此 以 外 ， 利 用 集群 系统 的 高 并 行 性 
能 进行 复杂 的 科学 、 工 程 计 算 ， 也 是 非常 有 经 济 价值 的 实施 方案 。 

对 于 集群 系统 来 说 ， 计 算 机 的 架构 是 一 个 非常 重要 的 问题 。 同 种 架构 的 计算 
机 之 间 ， 可 以 比较 容易 实现 集群 连接 。 对 于 异 构 的 计算 机 系统 ， 类 似 Java 的 中 
间 件 技术 可 以 解决 部 分 跨 平 台 的 问题 。 


7.4.2 集群 的 必要 性 


“分 而 治之 ”是 集群 技术 思想 的 本 质 ， 其 根本 目的 是 实现 系统 协同 一 致 的 工 
作 。 以 往 ， 企 业 用 户 在 构建 信息 应 用 系统 时 只 能 在 两 种 计算 体系 中 进行 选择 ， 一 
种 是 基于 主机 的 计算 体系 ， 大 体 上 采用 的 就 是 上 面 描述 的 分 区 方式 ; 另 一 种 就 是 
基于 客户 端 / 服 务 器 的 集群 型 计算 体系 。 基 于 主机 的 计算 体系 具有 良好 的 系统 可 
伸缩 性 、 可 靠 性 和 高 性 能 ， 但 它 昂贵 的 价格 迫使 用 户 在 系统 建设 之 初 就 在 硬件 系 
统 上 投入 巨大 资源 ， 而 用 户 花费 巨额 资金 购买 的 主机 系统 也 许 包含 了 许多 并 不 需 
要 的 功能 ， 造 成 资源 浪费 。 基 于 客户 端 /服务 器 的 集群 型 计算 体系 允许 用 户 根据 
实际 需要 逐步 增加 硬件 系统 ， 但 这 种 体系 的 系统 毕竟 不 是 真正 意义 上 的 集群 ,在 
应 用 升级 和 管理 方面 都 需要 付出 巨大 的 代价 ， 缺 乏 必 要 的 可 用 性 和 可 管理 性 ， 每 
增加 一 个 客户 端 /服务 器 的 连接 就 要 同时 增加 两 端的 管理 负担 。 

因此 ， 未 来 对 计算 速度 、 系 统 可 靠 性 和 成 本 实效 性 的 要 求 必 将 促使 发 展 男 外 
的 计算 机 模型 。 随 着 计算 机 网 络 的 出 现 ， 一 个 新 的 具有 更 高 性 价 比 的 体系 逐渐 成 
为 主流 ， 即 分 布 式 集群 计算 体系 。 当 用 户 需 要 完成 任何 任务 时 ， 分 布 式 集群 计算 
提供 了 尽 可 能 多 的 计算 机 处 理 能 力 和 数据 的 透明 访问 能 力 ， 同 时 实现 高 性 能 与 高 
可 靠 性 的 目标 。 

集群 计算 模式 是 最 经 济 的 计算 模式 。 集 群 系统 允许 用 户 把 普通 商用 硬件 系统 
组 成 机 群 ， 并 根据 需要 随时 在 机 群 中 增加 新 的 硬件 ， 提 高 系统 的 伸缩 性 ， 从 而 能 
够 在 价格 相对 低廉 的 中 低 端 平台 上 实现 过 去 只 有 高 端 系 统 才 具 备 的 性 能 。 在 提高 



















































































第 7 章 企业 内 容 管理 系统 的 部 署 * 125. 





系统 性 能 的 同时 降低 了 成 本 。 

集群 计算 以 其 优越 性 获得 了 更 加 广泛 的 关注 。 集 群 计算 的 主题 也 变 得 多 种 多 
样 的 ， 许 多 研究 人 员 正 在 研究 有 关 分 布 式 硬 件 体 系 结构 和 分 布 式 系统 软件 设计 的 
各 种 问题 ， 以 开发 利用 潜在 的 集群 并 行 性 。 

集群 计算 系统 的 种 类 多 种 多 样 ， 每 一 种 集群 系统 的 实现 涉及 不 同 的 系统 体系 
结构 。 对 一 些 用 户 来 说 ， 一 个 集群 系统 是 为 解决 单个 问题 而 紧密 结合 在 一 起 工作 
的 多 处 理 机 的 集合 ; 对 另 一 些 用 户 来 说 ， 一 个 集群 系统 可 能 意味 着 一 个 由 地 理 上 
分 散 的 各 自 独 立 的 处 理 机 组 成 的 计算 机 网 络 ， 这 些 处 理 机 连接 在 一 起 以 实现 对 不 
同 资源 的 共享 。 

然而 ， 集 群 这 个 词 在 计算 机 系统 中 被 如 此 广泛 应 用 以 至 于 对 它 的 概念 有 些 混 
乱 。 许 多 混乱 来 源 于 对 物理 分 布 和 逻辑 分 布 的 区 分 。 通 过 区 分 这 两 个 概念 ， 就 可 
以 更 准确 地 描述 一 个 分 布 式 系统 的 属性 。 

为 了 明确 分 布 式 集群 系统 的 概念 ， 和 采取 以 下 的 定义 : 在 用 户 看 来 ， 一 个 集群 
系统 是 一 个 单一 的 普通 系统 ， 然 而 运行 在 一 系列 自治 处 理 单 元 上 的 系统 ， 每 个 处 
理 单元 有 各 上 自 的 物理 内 存 空 间 ， 通 过 高 速 链 路 或 者 标准 化 网 络 连接 ， 节 点 间 通 过 
紧密 的 合作 实现 对 同一 任务 的 协同 计算 ， 系统 必须 支持 任意 数量 的 进程 和 节点 的 
动态 扩展 。 

建立 一 个 集群 系统 的 主要 目的 在 于 : 

1) 固有 的 应 用 得 以 保障 。 集 群 系统 以 一 种 很 自然 的 方式 开始 存在 ， 在 从 个 
人 计算 向 集群 分 布 式 计算 迁移 的 时 候 ， 可 以 保留 原 有 在 个 人 计算 系统 上 的 应 用 ， 
直接 将 原 有 的 应 用 在 新 的 集群 系统 中 运行 ， 并 获得 性 能 的 提升 。 这 也 是 集群 出 现 
的 一 大 原因 。 

2) 综合 考量 系统 的 成 本 以 及 达到 的 性 能 。 集 群 系统 的 并 行 性 降低 了 处 理 的 
瓶 贷 ， 提 供 了 全 面 改进 的 性 能 ， 也 就 是 说 ， 集 群 系统 提供 了 更 好 的 性 价 比 。 

3) 资源 共享 。 集 群 系统 能 有 效 地 支持 不 同位 置 的 用 户 对 信息 和 软 硬 件 资源 
的 共享 。 

4) 灵活 性 和 可 扩展 性 。 集 群 系统 可 以 增 量 扩展 ， 并 能 方便 地 修改 或 扩展 系 
统 以 适应 变化 的 环境 而 无 需 中 断 其 运行 。 

5) 实用 性 和 容错 性 。 依 靠 存 储 单元 和 处 理 单元 的 多 重 性 ， 集 群 系统 具有 在 
系统 出 现 故 障 的 情况 下 继续 运行 的 能 

6) 可 伸缩 性 。 集 群 系 统 能 方便 地 扩大 以 包括 更 多 的 硬件 和 软件 资源 。 


7.4.3 集群 的 可 扩展 性 


集群 的 可 扩展 性 ， 并 不 是 字面 意思 那样 ， 指 物理 设备 的 增多 ， 或 者 软件 模块 
的 多 少 ， 而 涉及 系统 体系 结构 的 机 理 变 革 ， 这 必然 关系 到 计算 体系 结构 的 发 展 。 
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体系 结构 的 发 展 经 历 了 几 十 年 的 演变 。 过 去 的 几 十 年 里 ， 计 算 机 本 身 的 发 展 
也 经 历 了 几 代 变更 。 从 第 一 代 的 真空 电子 管 和 继电器 存储 器 计算 机 ， 到 近年 以 超 
大 规模 集成 电路 为 代表 的 第 五 代 计 算 机 。 计 算 机 系统 的 速度 在 不 断 提 高 ， 造 价 和 
体积 却 不 断 减 小 。 系 统 软件 的 发 展 虽 然 没 有 硬件 系统 那么 令 人 瞩目 ， 却 也 从 汇 
编 、 机 絮语 言 的 时 代 逐 渐 步 和 以 跨 平台 、 可 扩展 、 适 合 分 布 式 计算 的 第 五 代 编程 
语言 体系 。 其 最 主要 的 代表 就 是 Java， 而 最 有 前 景 的 操作 系统 就 是 Linux 和 开放 
源码 运动 。 今 后 的 计算 机 系统 将 具有 更 强 的 能 力 ， 更 友好 的 操作 界面 ， 并 借助 互 
联网 的 分 布 式 超级 计算 平台 。 

过 去 ， 人 们 普遍 认为 计算 机 性 能 的 提高 主要 是 因为 生产 出 了 更 快 更 有 效 的 处 
理 器 。 这 种 观念 受到 了 并 行 处 理 概 念 的 挑战 。 分 而 治之 的 方法 使 得 聚集 的 计算 系 
统 能 够 实现 令 人 难以 置信 的 计算 能 力 。 近 年 来 昂贵 而 特制 的 并 行 超级 计算 机 向 集 
群 的 转换 趋势 越 来 越 强 ， 而 高 性 能 工作 站 标准 化 组 件 和 网 络 部 件 的 快速 发 展 成 为 
促成 这 种 转换 的 驱动 因素 。 

并 行 与 可 扩展 紧密 相连 。 现 代 计 算 机 的 一 个 公共 特点 是 并 行 性 。 不 论 从 计算 
机 的 体系 结构 还 是 微 处 理 器 的 发 展 方向 来 看 ， 并 行 性 逐渐 体现 在 每 一 个 角落 。 
X86 微 处 理 需 的 发 展 就 是 并 行 技 术 发 展 的 一 个 很 好 的 体现 : 多 流水 线 、 超 标量 设 
计 都 是 提高 CPU 的 并 行 能 力 的 关键 。 而 在 集群 的 体系 结构 中 ， 更 是 充分 利用 了 
并 行 性 这 一 特点 。 创 建 和 使 用 并 行 计 算 机 主要 是 为 了 解决 单 处 理 器 的 速度 瓶颈 ， 
利用 并 行 技术 来 提高 应 用 性 能 。 

从 男 一 个 角度 来 看 ， 因 为 并 行 技术 的 发 展 ， 也 大 大 促进 了 计算 机 系统 的 可 扩 
展 性 ， 同 时 在 单位 成 本 控制 上 也 有 了 很 大 的 进步 ， 使 得 基于 集群 的 并 行 计算 系统 
的 性 价 比 明显 优 于 独立 的 小 型 机 和 一 般 大 型 主机 系统 。 
7.4.3.1 可 扩展 性 的 具体 内 容 

如 果 能 够 通过 增加 资源 以 满足 不 断 增长 的 对 性 能 和 功能 的 要 求 ， 或 者 是 通过 
缩减 资源 ， 以 降低 成 本 ， 从 涵盖 硬件 和 软件 的 角度 上 讲 ， 可 以 把 符合 这 种 特性 的 
计算 机 系统 称 作 是 可 扩展 的 。 

但 是 ， 可 扩展 并 不 是 仅仅 意味 着 体积 的 扩大 、 数 量 的 增加 ， 它 也 涵盖 了 伸缩 
能 力 。 目 前 日 益 多 见 的 般 入 式 系统 就 是 很 好 的 例子 ， 它 既是 硬件 体积 、 计 算 能 
的 缩减 ， 又 是 软件 的 缩减 ， 如 许多 黄 入 式 操 作 系 统 往往 通过 剪裁 来 实现 。 可 前 
裁 、 可 伸缩 是 可 扩展 性 的 最 基本 特点 。 可 扩展 性 的 具体 内 容 还 包括 以 下 方面 : 

1) 功能 性 和 性 能 : 一 个 可 扩展 的 系统 应 该 能 够 提供 更 好 的 性 能 、 更 多 的 功 
能 。 系 统 的 总 体 计算 能 力 应 该 随 着 资源 的 增加 而 按照 比例 增长 。 

2) 成 本 伸缩 : 系统 能 力 扩 展 的 代价 必须 是 合理 的 。 粗 略 的 标准 是 ， 成 本 的 
增加 应 该 小 于 能 力 增 长 系数 。 但 因为 在 扩展 计算 系统 的 时 候 ， 不 仅仅 要 做 性 能 的 
考虑 ， 而 且 还 要 考虑 系统 的 可 用 性 、 稳 定性 等 ， 这 些 因 素 都 会 导致 系统 的 总 成 本 
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3) 可 兼容 性 : 包括 硬件 、 系 统 软件 和 应 用 软件 在 内 的 组 成 部 分 。 通 常 希 望 
原 有 的 程序 在 不 做 变动 或 只 作 少 量 的 变动 后 仍 可 以 使 用 ， 要 求 用 户 重 新 购置 设备 
和 重新 开发 是 不 现实 的 。 如 果 添 加 了 更 多 的 处 理 器 或 者 是 将 现 有 的 处 理 器 升级 到 
新 的 一 代 ， 新 增加 的 部 分 应 能 够 与 系统 的 其 余部 分 相 兼 容 ， 即 原 有 的 存储 器 、 磁 
盘 、 互 连 设备 以 及 外 设 仍 然 可 以 使 用 。 
7.4.3.2 可 扩展 性 的 分 类 

可 扩展 性 本 身 是 一 个 多 方面 的 概念 集合 ， 包 括 了 对 计算 资源 、 应 用 规模 、 技 
术 换 代 等 三 个 方面 的 扩展 内 容 。 

1. 资源 的 可 扩展 性 

考虑 资源 可 扩展 性 之 前 ， 首 先 要 确定 资源 的 真实 含义 是 什么 。 一 般 都 会 把 计 
算 机 硬件 设备 当 作 资源 ， 比 如 CPU 的 数量 、 存 储 设备 、LO 设备 等 。 但 从 广义 
的 角度 理解 ， 资 源 还 应 该 包括 操作 系统 、 应 用 软件 等 。 甚 至 ,在 日 益 复 杂 的 互联 
网 应 用 时 代 ， 资 源 的 概念 延伸 到 了 用 户 需 求 的 层次 上 。 

因此 ， 对 于 提供 服务 的 计算 机 系统 来 说 ， 为 用 户 提供 服务 的 一 切 软 、 硬 件 和 
其 他 配套 的 结构 都 可 以 看 作 资 源 。 因 此 如 果 我 们 从 资源 角度 来 考量 可 扩展 性 ， 就 
可 以 把 目标 定义 为 通过 增加 机 器 规模 〈( 即 处 理 器 数量 ) 、 投 入 更 多 的 存储 部 件 、 
升级 软件 甚至 是 改变 系统 的 体系 结构 ， 从 而 使 系统 具有 更 好 的 性 能 或 者 功能 。 

扩展 很 容易 让 人 联想 到 加 强硬 件 设 备 ， 其 中 最 明显 的 方法 就 是 增加 机 器 的 处 
理 器 数量 。 但 是 不 是 所 有 的 机 器 都 具备 相同 的 可 扩展 能 力 。 一 个 x86 的 SMP 系 
统 最 多 就 只 能 扩展 到 64 个 CPU; 而 一 台 IBM 的 SP2 却 可 以 扩展 到 最 多 $12 个 
CPU。 因 此 ， 扩 大 规模 并 不 是 简单 地 增加 部 件 的 数量 就 能 解决 问题 的 。 通 常 ， 随 
着 CPU 数量 的 增加 ， 包 括 RAM、 总 线 带 宽 、 网 络 等 子 系统 也 需要 随 之 增加 。 所 
以 ， 和 常常 看 到 ， 由 于 资源 扩展 所 带 来 的 技术 上 的 障碍 ， 仅 仅 是 增加 几 个 CPU 或 
者 其 他 部 件 ， 所 花费 的 代价 却 远 远 高 于 增加 的 那些 CPU 本 身 的 价值 。 那 么 , 谨 
慎 考 虑 扩展 规模 所 带 来 的 性 能 价格 比 的 增加 ， 如 何 有 效 地 利用 更 大 并 行 性 就 是 非 
常 必要 的 了 。 这 时 ， 通 过 RAM 的 数量 ， 扩 展 WO 速度 、 升 级 网 络 速度 或 者 改造 
网 络 拓扑 结构 反而 能 带 来 意 想 不 到 的 效果 。 

另 一 方面 ， 把 软件 也 看 作 系统 资源 的 话 ， 就 要 涵盖 很 广 的 范围 : 可 以 升级 新 
版 本 的 操作 系统 ， 使 它 具 有 更 多 功能 ;支持 更 多 线程 、 更 大 的 地 址 空间 ， 有 更 高 
效 的 内 核 ， 能 够 识别 更 多 的 新 硬件 ;也 可 以 安装 功能 强大 的 中 间 件 以 扩展 系统 的 
特殊 能 力 ; 还 可 以 利用 运行 库 来 支持 诸如 消息 传递 、 分 布 式 事务 处 理 等 特性 。 扩 
展 的 方法 不 一 而 足 ， 也 是 在 研究 集群 技术 时 主要 考虑 的 问题 。 

2. 应 用 的 可 扩展 性 

要 充分 扩展 集群 计算 系统 的 能 力 ， 不 仅 资源 是 可 扩展 的 ， 应 用 程序 也 必须 是 
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可 扩展 的 。 这 就 是 说 ， 相 同 程序 在 一 个 可 扩展 系统 上 运行 时 ， 其 性 能 随 规模 的 扩 
大 成 正比 例 的 改进 。 两 个 重要 的 考量 是 机 融 规 模 的 可 扩展 性 和 问题 规模 的 可 扩展 
性 。 理 想 的 情况 是 ， 当 处 理 融 的 数量 成 倍增 长 时 ， 系 统 处 理 能 力 成 倍增 长 。 或 者 
硬件 环境 不 变 的 情况 下 ， 仅 仅 改变 应 用 环境 的 工作 负载 ， 系 统 的 处 理 能 力 还 能 否 
保持 不 变 呢 ? 实际 的 情况 是 ， 应 用 的 限制 最 终 无 法 通过 简单 地 增加 机 器 资源 的 方 
法 加 以 突破 。 只 有 对 应 用 程序 本 身 和 系统 体系 结构 进行 重大 修改 后 ， 才 能 使 用 更 
多 处 理 器 和 处 理 更 多 的 问题 。 

通常 ， 应 用 可 扩展 性 不 只 依赖 于 处 理 带 规模 和 问题 规模 ， 还 依赖 于 机 带 的 存 
储 顺 容量 、LILO 能 力 ， 以 及 通信 能 力 。 所 有 因素 一 起 影响 着 可 扩展 性 。 

总 的 来 说 ， 考 虑 应 用 可 扩展 问题 ， 需 要 从 更 加 广义 的 角度 上 看 ， 而 不 仅仅 是 
上 述 的 两 个 方面 。 那 么 我 们 就 来 看 一 下 可 扩展 的 另 一 个 重要 的 方面 一 一 技术 换代 
的 可 扩展 性 。 

3. 技术 换代 的 可 扩展 性 

技术 换代 的 可 扩展 性 是 局 部 概念 而 非 全 局 概念 。 这 里 主要 是 指 计算 机 系统 能 
够 随 着 拉 术 的 变更 、 换 代 ， 在 保持 原 有 的 可 用 性 基础 上 ， 通过“ 升级” 部件 的 
手段 提高 系统 的 性 能 或 者 功能 。 这 里 的 升级 可 能 是 我 们 常见 的 更 换 更 高 主 频 的 
CPU， 也 可 能 是 增加 系统 的 内 存 数量 ,还 可 能 是 升级 操作 系统 到 更 新 的 版 本 。 

总 的 看 来 ， 计 算 机 系统 中 CPU 的 发 展 速度 最 快 ， 而 内 存 的 速度 和 单位 容量 
的 提升 就 慢 一 些 ， 硬 盘 就 会 更 慢 (受到 机 械 的 限制 )， 而 最 慢 的 就 数 程序 设计 语 
言 了 ， 到 现在 为 止 , 设计 人 员 都 还 在 用 类 C 编写 关键 的 大 型 系统 ， 特 别 是 集群 
系统 应 用 。 

并 行 系统 的 空间 也 是 在 扩展 集群 系统 时 的 一 个 重要 考量 因素 。 新 的 设备 是 否 
能 够 容 和 人 原 有 的 机 箱 内 ， 扩 展 的 需求 是 否 能 通过 现 有 的 互 连 技术 得 到 满足 ， 路 地 
域 分 布 式 技术 的 发 展 是 否 能 带 来 更 大 更 强 的 系统 ， 这 些 问题 都 缠绕 在 技术 换代 的 
思考 过 程 中 。 

并 行 技术 发 展 初期 ， 系 统 大 都 是 同 构 的 ， 像 具有 完全 一 致 内 核 的 MPP 系统 ， 
而 集群 也 都 是 先 在 同 构 的 框架 下 实现 。 而 为 了 更 好 利用 各 类 异 构 计 算 资源 ， 势 必 
需要 充分 支持 异 构 的 并 行 集群 。 那 么 ， 异 构 可 扩展 性 这 一 性 质 就 反映 了 一 个 系统 
通过 集成 由 不 同 设计 者 和 厂商 所 提供 的 硬件 和 软件 部 分 而 进行 扩展 的 能 

异 构 扩展 提倡 使 用 具有 标准 、 开 放 系 统 结 构 和 接口 的 部 件 。 在 软件 领域 ， 这 
种 特点 被 称 之 为 可 移植 性 。 在 可 移植 性 方面 ，Java 语言 的 跨 平 台 性 将 会 是 集群 技 
术 的 最 佳 解决 方案 。 
7.4.3.3 可 扩展 的 并 行 计 算 体系 结构 

在 集群 计算 和 分 布 式 系统 中 ， 系 统 体系 结构 的 发 展 主要 有 三 个 具有 代表 性 的 
结构 。 每 种 体系 结构 的 差别 不 大 ， 关 键 在 于 互 连 技术 、 节 点 的 复杂 度 和 耦合 程度 
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的 不 同 。 

1. 无 共享 磁盘 体系 结构 

如 图 7-6 所 示 ， 这 是 目前 大 部 分 集 
群 系统 所 采取 的 体系 结构 。 集 群 中 的 
每 一 个 节点 都 是 完整 独立 的 操作 系统 
和 硬件 设备 集合 。 节 点 之 间 通 过 局 域 
网 或 者 开关 阵列 以 松 耦 合 的 方式 连接 
起 来 ， 彼 此 分 享 节点 的 部 分 甚至 全 部 
可 用 资源 : CPU、 内存、 磁盘 、1/0 设 
备 等 ， 以 形成 一 个 对 外 单一 、 强 大 的 
计算 机 系统 。 这 类 系统 对 SSI (单一 系 














图 7-6 无 共享 磁盘 体系 结构 


统 映像 ) 的 能 力 较 弱 ， 需 要 特殊 的 中 间 件 或 者 OS 〈 操 作 系统 ) 扩展 加 以 支持 。 


2. 共享 磁盘 体系 结构 

如 图 7-7 所 示 ， 这 类 体系 结构 中 ， 
每 一 个 节点 基本 仍 是 独立 的 计算 机 ， 
没有 或 者 不 使 用 本 地 的 磁盘 文件 系统 。 
分 布 式 文件 系统 正 是 这 类 体系 结构 的 
应 用 体现 。 常 见 的 NFS、AFS 或 者 GFS 
都 属于 这 个 范畴 。 而 硬件 上 的 解决 党 
常 通过 共享 磁盘 阵列 或 者 SAN (存储 
区 域 网 络 及 其 协议 ) 来 实现 。 该 体系 
结构 主要 能 够 解决 区 域 存储 空间 的 容 
量 问题 ， 通 过 构造 单一 的 虚拟 的 文件 


























系统 ， 提 供给 整个 集群 一 个 巨大 的 存储 设备 。 尤 其 在 一 些 高 可 用 的 场合 ， 共 享 磁 
盘 阵 列 常常 能 够 解决 文件 系统 容错 和 数据 一 致 等 可 靠 性 问题 。 





3. 共享 存储 器 体系 结构 


如 图 7-8 所 示 ， 从 实现 的 难度 上 讲 ， 不 
论 是 硬件 制造 的 复杂 性 还 是 软件 的 实现 难 
度 ， 这 种 体系 结构 都 大 大 超过 其 他 几 类 体系 
结构 的 实现 。 实 现 这 类 体系 结构 的 集群 系统 
有 DSM (分 布 式 共享 存储 集群 )、NUMA、 
ccNUMA 等 技术 。 在 这 类 体系 结构 中 ， 可 以 
将 多 个 节点 的 计算 资源 集合 在 一 起 ， 形 成 一 





个 内 存 空 间 一 致 的 单一 系统 。 











图 7-8 共享 存储 器 体系 结构 
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7.4.3.4 可 扩展 与 SSI 的 关系 

任何 形式 的 并 行 集群 ,不管 适 用 于 密集 计算 还 是 高 可 靠 商 用 环境 ， 都 要 有 恨 
好 的 可 扩展 性 、 可 接受 的 单位 计算 成 本 、 可 预期 的 技术 前 景 。 因 此 ， 在 设计 内 容 
管理 系统 的 集群 系统 时 ， 要 始终 关注 可 扩展 性 这 一 核心 的 要 求 。 

但 从 另外 一 个 角度 来 看 待 并 行 计算 集群 的 时 候 ， 就 会 有 不 同 的 结论 了 。 其 
实 ， 对 于 最 终 用 户 和 编程 人 员 来 说 ， 并 行 计算 机 模型 的 重点 在 于 集群 系统 对 外 呈 
现 的 是 什么 样 的 计算 系统 ， 即 通常 所 称 的 SSI (单一 系统 映像 ) 。 

如 果 作 为 编程 者 ， 当 然 希 望 所 面 对 的 是 一 台 机 器 而 不 是 一 堆 机 器 ， 一 台 机 器 
意味 着 单一 的 寻 址 空间 ， 无 须 处 理 消 息 传 递 或 者 远程 调用 等 复杂 的 编程 技术 。 那 
么 ， 在 这 样 的 观点 下 ， 具 有 单一 地 址 空间 的 集群 系统 就 具备 了 这 个 能 力 ; 或 者 使 
用 者 希望 拥有 一 个 巨大 的 一 致 的 (只 有 一 个 根 目录 ) 文件 系统 ， 那 就 需要 在 文 
件 系 统 层次 上 进行 SSI 的 工作 。 

但 从 用 户 的 角度 来 看 ， 用 户 并 不 关心 系统 实现 者 是 如 何 处 理 诸 如 地 址 空间 、 
消息 传递 细节 ， 他 始终 面 对 是 一 台独 立 的 计算 机 系统 ， 这 样 可 以 减少 他 使 用 的 复 
杂 度 ， 不 需要 在 多 个 系统 之 间 来 回 切换 ， 可 以 方便 的 管理 他 所 面 对 的 “一 台 机 
器 ” 。 那 么 ， 提 供 管 理 层次 和 使 用 层次 的 SSI 就 是 必要 的 了 。 

所 以 ， 并 行 计算 模型 就 是 由 使 用 者 (包括 程序 员 、 用 户 ) 看 到 的 一 个 抽象 
并 行 计算 机 ， 能 够 进行 顺序 计算 〈 其 背后 可 能 是 并 行 的 运算 程序 ) 和 并 行 计算 
任务 的 计算 机 系统 。 

按照 处 理 器 、 内 存 、0S 
以 及 互联 方法 来 进行 并 行 系 
统 的 分 类 ， 在 参考 彼此 可 扩 
展 性 和 单一 系统 映像 的 这 两 ”省 
个 方面 ， 可 以 得 到 如 图 7-9 各 
所 示 的 图 形 。 

图 7-9 中 ， 节 点 可 以 是 
一 台 PC、 一 台 工 作 站 或 者 
SMP 服务 器 。 节 点 的 复杂 性 
指 的 是 软件 和 硬件 的 能 
一 般 来 说 ,集群 节点 要 比 
MPP 复杂 一 些 ， 因 为 每 个 集 图 7-9 集群 、 分 布 式 、MPP、 SMP 体系 结构 的 比较 
群 节点 都 有 独立 的 操作 系统 
和 外 围 设 备 ， 而 MPP 中 的 节点 可 能 仅仅 是 操作 系统 的 一 个 微 内 核 。 

与 PC 以 及 商用 集群 系统 相 比 ，SMP 服务 器 的 节点 复杂 性 相对 高 一 些 。 比 
如 ， 最 常见 的 x86 构架 SMP 服务 器 时 ,不 论 主板 还 是 总 线 技术 都 远 远 比 PC 复 
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杂 。 而 且 为 了 支持 企业 级 应 用 环境 ，SMP 还 需要 支持 更 多 的 高 端 外 设 ， 提 供 存 
储 设备 的 即 插 即 用 能 力 ， 内 存 数据 纠 错 等 高 端 技 术 ， 这些 技 术 的 应 用 势必 增加 
SMP 的 复杂 程度 。 

MPP 通常 是 指 采用 无 共享 资源 结构 的 大 型 并 行 处 理 系统 ， 一 般 包 括 几 百 个 
处 理 需 节点 ， 节 点 上 一 般 运 行 一 个 不 完整 的 0S (也 叫 微 内 核 ) ， 节 点 之 间 通 过 
高 速 开 关 互 联 。 这 样 的 专 有 系统 往往 具有 比较 好 的 可 扩展 能 力 ， 但 是 在 技术 的 更 
新 换代 上 受 限 于 专 有 系统 本 身 。 

SSI 作为 集群 实现 的 一 大 要 素 ， 其 范围 包括 了 单一 的 应 用 层次 、 子 系统 、 运 
行 时 系统 、 操 作 系 统 内 核 以 及 硬件 层次 。 或 者 说 ，SSI 不 是 绝对 的 ， 是 一 个 相对 
的 概念 ， 取 决 于 用 户 从 什么 样 的 角度 看 待 系统 ， 是 卫 层面 上 还 是 内 存 空间 上 或 
者 是 文件 系统 的 SSI， 这 都 由 最 终 的 应 用 环境 决定 。 

到 了 分 布 式 系统 的 这 个 范畴 ， 系 统 往往 提供 多 个 系统 映像 ， 呈 现 出 一 个 多 人 
口 、 多 映像 的 系统 集合 ， 每 个 节点 具有 很 高 的 自治 能 力 。 而 MPP、SMP 则 以 紧 
竣 的 方式 提供 相对 单一 的 计算 资源 ， 如 同一 个 巨大 的 工作 站 。 在 分 布 式 系 统 中 ， 
除了 使 用 同 构 节点 外 ， 还 根据 需要 常常 使 用 异 构 的 平台 ， 这 势必 增加 分 布 式 系统 
的 设计 难度 和 管理 复杂 性 。 

对 于 这 四 类 系统 来 说 ，SMP 的 SSI 程度 最 高 ， 它 是 在 所 有 的 层次 上 提供 SSL， 
即 共 享 一 切 系统 资源 : 单一 地 址 空间 、 单 一 的 文件 系统 、 单 一 的 操作 系统 内 核 
等 ， 看 起 来 与 一 台 单独 的 单 CPU 没什么 区 别 。MPP 仅仅 在 某 些 应 用 层 和 系统 层 
文 持 SSI。 集 群 提供 的 SSI 程度 更 低 ， 一 般 只 能 满足 某 一 两 个 方面 的 SSI 要 求 。 
而 对 于 分 布 式 系统 ， 比 如 网 格 ， 其 SSI 的 实现 程度 就 低 得 多 了 。 通 过 类 似 Java 这 
样 的 跨 平 台 工 具 ， 分 布 式 系统 或 许可 以 提供 某 一 定义 下 的 SSI 能 力 ， 比 如 单一 的 


Java 运行 空间 。 
7.4.4 集群 的 重要 指标 


对 于 集群 ， 有 一 个 简单 的 概念 : 集群 是 全 体 计 算 机 (也 叫 节点 ) 的 集合 ， 
这 些 计算 机 由 高 性 能 网 络 或 者 LAN 物理 地 相连 。 典 型 的 情况 下 ， 每 个 计算 机 节 
点 可 以 是 一 台 SMP、 一 台 工 作 站 或 者 是 最 普通 不 过 的 PC 设备 。 最 重要 的 是 ， 这 
些 各 自 独立 的 计算 机 要 能 够 相互 协作 一 起 工作 ， 而 且 对 外 呈现 集成 的 、 单 一 的 计 
算 机 资源 。 

如 果 只 是 简单 地 用 LAN 把 各 个 节点 设备 连接 起 来 ， 就 称 之 为 集群 ， 是 不 可 
能 具备 实用 价值 的 。 考 察 集群 很 重要 的 是 集群 的 几 个 性 能 及 功能 指标 。 

1. 能 用 性 

由 于 集群 中 的 每 个 节点 都 是 运行 在 传统 的 通用 平台 上 ， 故 用 户 能 在 熟悉 和 成 
熟 的 环境 中 开发 和 运行 程序 。 通 用 平台 提供 编程 环境 、 操 作 界 面 、 控 制 监控 系统 
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的 工具 甚至 是 CUI， 人 允许 用 户 运行 原来 在 工作 站 上 的 大 量程 序 而 无 需 任 何 修改 。 
所 以 ， 可 以 把 集群 系统 看 作 一 个 大 型 的 工作 站 ， 对 于 使 用 者 ， 与 平时 的 操作 没 什 
么 区 别 ， 只 是 性 能 上 提高 了 许多 。 

2. 可 用 性 

可 用 性 是 指 一 个 系统 从 事 生产 性 使 用 的 时 间 百 分 比 ， 即 MTBF (平均 无 故障 
时 间 ) 。 传 统 的 整体 系统 ， 比 如 主机 系统 和 容错 系统 依靠 昂贵 的 定制 设计 来 实现 
高 可 用 性 。 集 群 不 使 用 定制 组 件 ， 而 使 用 廉价 的 商品 化 组 件 以 提供 高 可 用 性 ， 而 
高 度 的 设备 元 余 则 是 集群 最 常 使 用 的 方式 。 

处 理 器 和 存储 器 : 集群 有 多 个 处 理 器 和 存储 器 部 件 ， 当 某 个 部 件 失效 时 ， 其 
他 的 仍然 可 以 使 用 ,不 影响 集群 整体 的 运行 。 与 此 相反 ， 在 SMP 中 ， 由 于 处 理 
器 通过 共享 存储 器 和 总 线 通信 ， 所 以 存储 髓 一 旦 失效 将 会 导致 系统 崩溃 。 存 储 器 
就 成 了 SMP 的 “ 单 点 失效 ”。 

磁盘 阵列 :常见 的 RAID 0 或 者 5， 都 能 够 满足 计算 机 的 磁盘 元 余 容 错 需求 。 
在 集群 中 ， 往 往 使 用 多 个 局 部 磁盘 ， 通 过 标准 的 共享 协议 (NFS，IFS 等 ) 以 支 
持 容错 需求 。 当 某 个 节点 的 本 地 磁盘 失效 时 ， 可 以 通过 远程 磁盘 继续 运行 。 常 见 
的 有 NAS 设备 ， 一 种 专用 于 集群 网 络 存 储 的 磁盘 设备 。 或 者 借助 分 布 式 文件 系 
统 软件 ， 实 现 多 个 集群 节点 之 间 的 磁盘 容错 。 

操作 系统 : 一 般 地 说 ， 集 群 在 某 一 层次 上 能 够 实现 单一 系统 映像 。 但 是 多 个 
操作 系统 映像 还 是 存在 的 ， 每 个 节点 都 有 一 个 独立 的 操作 系统 。 当 某 个 节点 因为 
软件 或 硬件 故障 而 崩溃 ， 其 他 的 节点 仍然 不 受 影响 继 续 工 作 ， 而 整个 集群 也 与 原 
先 没 有 什么 两 样 。 我 们 有 时 也 把 这 一 特性 叫做 节点 容错 能 

通信 网 络 : 好 的 集群 设计 充分 考虑 了 各 种 可 能 出 现 的 故障 情况 ， 并 采取 一 切 
可 行 的 措施 加 以 避免 。 集 群 节点 的 通信 故障 也 是 必须 考虑 的 。 在 一 个 大 型 的 复杂 
的 集群 中 ， 一 段 通信 链 路 的 故障 可 能 导致 不 止 一 个 的 节点 失效 ， 甚 至 会 使 得 整个 
集群 变 得 不 可 用 。 因 此 ， 在 集群 的 关键 点 之 间 采 取 合 适 的 元 余 链 路 就 非常 必要 
了 。 一 般 考虑 到 集群 的 入 口 节 点 、 主 控 节 点 或 者 监视 节点 比较 容易 成 为 单 点 失 
效 ， 那 么 在 这 些 节 点 的 接 入 策略 中 ， 使 用 备份 链 路 可 以 达到 比较 好 的 效果 。 

3. 可 扩展 性 

一 个 集群 的 计算 能 力 随 节 点 增多 而 增加 。 集 群 的 可 扩展 性 是 群体 可 扩展 性 。 
因为 是 松 耦 合 的 结构 ， 集 群 能 扩展 至 几 百 个 节点 ， 而 对 于 SMP 来 讲 ， 要 超过 几 
十 个 节点 就 非常 困难 。 

在 SMP 中 ， 共 享 存 储 器 以 及 存储 器 总 线 是 系统 性 能 的 瓶颈 。 相 同 的 程序 集 
运行 于 集群 时 ， 不 存在 存储 器 瓶颈 。 每 个 节点 可 在 一 个 节点 上 执行 ， 充 分 使 用 局 
部 存储 器 。 对 于 这 类 应 用 ， 集 群 可 提供 更 高 的 总 体 存储 器 带宽 和 减少 存储 器 时 
延 。 集 群 的 局 部 磁盘 也 聚集 为 大 磁盘 空间 ， 可 容易 地 超过 集中 式 RAID 磁盘 空 
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间 。 增 强 的 处 理 、 存 储 和 LO 能 力 使 得 集群 只 要 使 用 经 良好 开发 的 ， 如 PVM 或 
MPI 那样 的 并 行 软件 包 ， 就 可 求解 大 型 应 用 问题 。 

SMP 不 具有 高 可 扩展 能 力 ， 因 为 它 使 用 竞争 总 线 和 集中 式 共享 存储 器 。 单 
操作 系统 映像 及 共享 存储 器 是 两 个 潜在 的 单 失 效 点 ， 会 降低 SMP 的 可 用 性 。 

容错 系统 有 极 高 的 可 用 性 ,但 扩展 的 代价 昂贵 。 而 MPP 的 扩展 能 力 要 更 强 

些 ， 而 且 可 以 保持 比较 好 的 SSI 能 力 。 目 前 ,集群 处 于 相对 折 中 的 位 置 ， 将 向 
着 更 高 性 能 更 高 可 用 性 的 方向 扩展 。 
4. 性 能 价格 比 

集群 能 以 有 效 的 成 本 获取 上 述 优 点 。 传 统 的 超级 计算 机 以 及 MPP 的 成 本 很 
易 达 到 几 千 万 美元 。 与 此 相 比 ， 具 有 相同 峰值 性 能 的 集群 价格 则 要 低 1 ~2 个 数 
量 级 。 集 群 大 量 地 采用 商品 化 部 件 ， 它 们 的 性 能 和 价格 遵循 摩尔 定律 ， 使 集群 的 
性 能 价格 比 的 增长 速率 远 快 于 MPP。 

设计 一 个 具有 良好 的 扩展 集群 系统 ， 就 要 兼顾 以 下 方面 : 

首先 ， 尽 量 使 集群 的 各 个 组 成 部 件 相 互 独立 ， 以 使 独立 的 局 部 扩展 成 为 可 
能 ， 并 且 保 证 向 后 兼容 的 特性 。 还 要 尽 可 能 采用 商品 化 的 组 件 ， 包 括 0S、 互 连 
网 络 、 主 机 系统 甚至 是 应 用 编程 环境 。 最 终 实 现 算法 独立 于 体系 结构 、 应 用 独立 

平台 、 语 言 独 立 于 机 器 、 节 点 独立 于 网 络 。 

其 次 ， 就 是 选择 合适 的 实现 模型 来 进行 集群 系统 的 设计 任务 ， 尽 量 使 用 流行 
的 开放 的 标准 件 ， 以 降低 单位 成 本 。 

最 后 ， 在 设计 的 时 候 还 要 尽量 平衡 性 能 ， 避 人 免 系统 里 出 现 的 “ 木 桶 原理 ”; 
此 外 在 考虑 可 用 性 的 时 候 要 注意 单 点 失效 的 问题 ， 以 免 实际 应 用 中 因为 小 的 错误 
导致 整个 系统 不 可 用 。 

总 之 ,综合 上 述 的 方方面面 ， 可 以 得 到 集群 的 几 大 要 素 . 

独立 的 节点 : 每 个 节点 是 一 台 完整 的 计算 机 ， 一 般 是 单一 的 系统 。 

单一 系统 映像 能 力 : 一 个 集群 是 一 个 单一 的 计算 资源 。 集 群 将 节点 作为 单独 
的 资源 ， 借 助 于 单一 系统 映像 技术 ， 实 现 统 一 资源 单一 人口 的 概念 。SSI 使 得 集 
群 更 加 易于 使 用 和 管理 。 

有 效 的 节点 间 连 接 : 集群 中 的 节点 ， 通常 使 用 商品 化 网 络 ， 如 以 太 网 、FD- 
DI 或 者 光纤 、ATM 等 。 此 外 ， 还 使 用 标准 的 网 络 协议 以 建立 进行 节点 间 的 通信 
机 制 。 这 些 都 保证 集群 通信 的 有 效 进行 。 

增强 的 可 用 性 : 集群 化 提供 了 一 个 成 本 有 效 的 方法 以 增加 一 个 系统 的 可 用 
性 ， 比 起 主流 的 部 件 级 容错 产品 ， 集 群 往往 能 够 提供 更 合理 的 花费 以 达到 效果 。 
商用 领域 多 数 以 加 强 系统 的 可 用 性 为 设计 目标 ， 因 此 可 以 使 用 集群 中 的 技术 加 以 
实现 。 

更 好 的 性 能 : 客观 来 讲 ， 集 群 的 诞生 是 因为 性 能 驱动 所 促成 的 。 在 科学 计 



















































































134 . 企业 内 容 管理 理论 与 实践 








算 、 工 程 应 用 、 远 程 虚拟 现实 仿真 等 服务 领域 中 ， 集 群 应 该 能 够 提供 更 高 的 性 
能 ， 人 允许 将 集群 作为 超级 服务 器 使 用 ， 在 最 短 的 时 间 内 完成 原本 单机 系统 无 法 顺 
利 完 成 的 任务 ， 或 者 是 提供 巨大 的 磁盘 和 内 存 空 间 ， 实 现 那 些 不 可 能 的 任务 。 


7.4.5 集群 的 分 类 


首先 ， 来 分 析 一 下 组 成 集群 计算 机 系统 主要 部 件 有 哪些 ? 一 个 较为 完整 的 集 
群 系统 应 包含 下 列 部 件 ; 

多 个 高 性 能 的 计算 机 (PC、 工 作 站 或 者 SMP 服务 器 ) ; 优秀 的 操作 系统 
(分 层 结构 或 者 基于 微 内 核 ) ; 高 性 能 网 络 开关 ( 千 焰 位 以 太 网 或 者 类 似 Myrinet 
的 专 有 开关 网 络 ) ; 网 络 接口 卡 (NIC) ; 快速 通信 协议 和 服务 (如 活动 消息 和 快 
速 消息 ) ; 集群 中 间 件 (单一 系统 映像 和 可 用 性 支持 ); 硬件 ， 如 DEC 的 内 存 通 
道 、 硬 件 DSM 和 SMP 技术 ; 操作 系统 内 核 或 者 粘 合 层 ， 如 MC 和 GLUnix; 应 用 
程序 和 子 系统 ; 应 用 程序 、 系 统管 理工 具 和 电子 表格 ; 实时 系统 、 软 件 DSM 和 
并 行文 件 系统 ; 资源 管理 融和 调度 软件 ， 如 LSF 负载 均衡 和 CODINE 分 布 式 网 络 
环境 的 计算 ; 并 行 编程 环境 和 工具 ， 编 译 髓 、PVM、MPI; 应 用 程序 : 串 行 和 
并 行 。 

这 些 组 成 部 件 并 非 在 每 一 类 集群 系统 中 都 是 必须 的 ， 多 数 系统 往往 只 实现 其 
中 的 几 种 ， 主 要 是 根据 具体 的 需求 来 定 。 但 如 果 以 参考 模型 的 角度 来 看 ， 对 于 理 
解 各 个 部 件 所 处 的 位 置 及 其 作用 来 说 ， 建 立 层次 结构 描述 有 助 于 从 整体 了 解 集 
群 。 在 系统 功能 实现 中 ， 所 有 这 些 部 件 分 别 在 不 同 的 层次 上 完成 相应 的 功能 。 

集群 的 组 成 涵盖 了 软件 到 硬件 的 几乎 每 一 个 方面 。 从 底层 到 顶层 ， 履 盖 了 现 
有 的 硬件 构造 、 网 络 设计 、 操 作 系统 、 中 间 件 以 及 应 用 环境 等 所 有 层次 的 技术 内 
容 。 那 么 ， 在 每 一 层 选择 什么 样 的 技术 就 非常 重要 。 采 用 现 有 的 成 熟 的 产品 技 
术 ， 可 以 大 大 降低 构造 集群 的 技术 和 资金 风险 ， 而 选择 适当 的 层次 和 技术 点 作为 
突破 ， 又 往往 是 解决 性 能 、 安 全 或 者 其 他 特殊 需求 的 关键 。 

现实 中 的 产品 通常 会 是 某 几 个 特性 的 综合 。 对 于 这 些 特性 ， 从 不 同 的 参考 因 
素来 进行 考量 ， 可 以 将 集群 按照 以 下 几 个 方面 进行 分 类 . 

1. 按照 用 途 分 类 

根据 集群 的 用 途 通 常 把 集群 分 为 三 种 ; 

1) 强调 计算 能 力 的 高 性 能 计算 (HP) 集群 ， 著 名 的 Beawulf 集群 就 是 极 好 
的 例子 。 

2) 强调 可 用 性 的 HA 商用 和 集群， 开放 源 码 社区 中 的 Mon 项 目 和 REDHAT 的 
PIRANAHA 都 是 值得 推荐 的 HA 集群 方案 。 此 外 还 有 传统 的 SP2 、Trucluster 、So- 
laris MC。 

3) 综合 了 HA 的 能 力 ， 又 实现 了 HP 的 集群 ， 强 调 高 吞吐 量 的 综合 型 集群 ， 
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比如 MOSIX，LVS。 

应 用 总 是 在 变化 的 。 最 早 集群 只 为 解决 计算 问题 而 诞生 ， 随 着 需求 的 发 展 才 
出 现 HA 商用 机 群 ， 以 及 后 来 的 综合 性 质 较 强 的 高 符 吐 系统 ， 将 来 一 定 会 有 更 新 
种 类 的 集群 出 现 。 

2. 按照 节点 的 归属 情况 分 类 

按照 节点 的 归属 情况 ， 可 以 分 为 专用 集群 和 “兼职 ”集群 ， 也 被 称 之 为 独 
用 型 和 企业 型 。 

专用 型 集群 往往 用 于 超级 计算 任务 或 者 用 廉价 PC 组 合成 的 大 型 工作 站 ， 具 
有 以 下 特点 : (一 般 安装 在 机 房 的 机 架 上 ; 外 多 数 由 同类 型 节点 同 构 地 组 合 而 
成 ; @) 一 般 通过 一 个 前 端 进行 访问 。 

该 集群 主要 是 为 了 取代 传统 的 主机 或 者 超级 计算 机 。 可 以 把 专用 型 集群 当 作 
单个 计算 机 那样 来 安装 、 使 用 和 管理 。 允 许多 用 户 登 录 到 集群 上 进行 交互 式 作业 
或 批 作 业 。 可 以 大 大 提高 吞吐 量 ， 以 及 缩短 响应 时 间 。 

构造 “兼职 ”集群 主要 是 为 了 节省 成 本 并 充分 利用 节点 的 空闲 资源 ， 特 点 
如 下 : 

1) 节点 必须 是 完整 的 SMP、 工 作 站 或 者 PC， 连 接着 所 有 必需 的 外 围 设备 。 

2) 地 理 上 节点 是 分 布 的 ， 不必 处 在 同一 个 空间 内 。 

3) 市 点 可 以 有 多 个 “ 属 主 ”。 集 群 管理 者 对 节点 的 管理 权限 是 有 限 的 。 而 
且 ， 所 有 者 的 本 地 任务 优先 级 往往 高 于 集群 的 任务 。 

4) 集群 大 多 是 异 构 的 ， 互 联 方式 以 标准 通信 网 络 为 基础 。 

从 上 面 的 比较 不 难 发 现 ， 使 用 节点 资源 的 方式 导致 了 两 种 不 同 归 属 集群 的 出 
现 。 专 有 集群 中 ， 特 定 个 体 并 不 拥有 一 个 工作 站 ,或 者 是 一 个 节点 ,资源 是 集群 
范围 内 共享 的 ， 并 行 计算 可 以 在 整个 集群 上 执行 。“ 兼 职 ” 集 群 中 个 人 拥有 工作 
站 ， 应 用 程序 靠 “ 穷 取 ”CPU 时 间 来 进行 运算 。 导 致 这 种 情况 得 主要 原因 是 ， 
大 多 数 工作 站 的 CPU 时 间 都 是 闲置 的 ， 即 使 在 高 峰 期 也 很 少 超过 50% 。 有 时 也 
把 非 专 用 的 、 动 态 变化 的 、 集 群 上 运行 的 并 行程 序 叫 做 自 适应 并 行 计算 。 

3. 按照 组 装 分 式 分 类 

根据 组 装 方式 ， 主 要 取决 于 互联 技术 和 计算 机 空间 技术 。 在 松 耦 合 的 集群 
中 ， 节 点 一 般 是 相对 独立 的 PC 或 者 工作 站 ， 拥 有 完整 的 外 围 设 备 : 键盘 、 鼠 
标 、 显 示 顺 。 彼 此 通过 LAN 连接 ,距离 上 可 以 是 在 一 个 机 房 内 ， 也 可 以 路 楼 宇 ， 
甚至 可 以 扩展 到 一 个 园区 ( 比如 校园 网 ) 的 范围 。 随 着 带宽 技术 的 发 展 ， 现 在 
的 松 耦合 集群 已 经 可 以 跨 地 域 范围 进行 资源 整合 。 

紧 耦 合集 群 往往 从 空间 利用 率 、 有 效 带 宽 等 角度 考虑 集群 的 互 连 。 大 家 都 知 
道 ， 茶 种 程度 上 ， 网 络 的 距离 和 带宽 是 成 反比 的 。 越 是 短 距 离 的 技术 越 能 实现 更 
高 的 带宽 。 因 此 ， 就 有 专用 集群 往往 采用 了 高 带宽 、 低 延 时 的 通信 和 网络 ， 并 将 节 
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点 不 必要 的 外 围 设 备 去 掉 ， 仅 仅 保 留 必 要 的 主机 (CPU 、 内 存 、 硬 盘 ) ， 安 置 在 
一 个 或 者 彼此 靠近 的 机 架 中 。 这 样 ， 不 仅 可 以 充分 利用 短 距离 通信 的 有 效 带 宽 ， 
例如 千 兆 位 以 太 网 ， 甚 至 是 万 兆 位 以 太 网 ; 还 可 以 大 大 节省 节点 占用 的 空间 ， 同 
时 也 方便 集中 管理 。 在 紧 耦 合 技术 发 展 中 ， 甚 至 出 现 了 在 一 个 机 箱 内 作 集 群 的 产 
Blade Cluster Server 又 称 为 刀片 服务 器 。 

刀片 服务 器 是 一 种 高 可 用 高 密度 (High Availability High Density，HAHD ) 
的 低 成 本 服务 器 平台 ， 是 专门 为 特殊 应 用 行业 和 高 密度 计算 机 环境 设计 的 。 其 中 
每 一 块 “ 刀 片 ”实际 上 就 是 一 块 增强 的 系统 主板 。 它 们 可 以 通过 本 地 硬盘 启动 
自己 的 操作 系统 ， 如 Windows NT/2000 、Linux 、Solaris 等 ， 类 似 于 一 个 个 独立 的 
服务 器 节点 。 在 这 种 模式 下 ， 每 一 个 主板 运行 自己 的 系统 ， 服 务 于 指定 的 不 同 用 
户 群 ， 相 互 之 间 没 有 关联 。 不 过 可 以 用 SSI 软件 将 这 些 主板 集合 成 一 个 单一 的 集 
群 映像 。 

在 集群 模式 下 ， 所 有 的 主板 可 以 连接 起 来 提供 高 速 的 网 络 环境 ， 可 以 共享 资 
源 ， 为 相同 的 用 户 群 服务 。 在 集群 中 插 人 新 的 “刀片 ”， 可 以 提高 整体 性 能 
由 于 每 块 “ 刀 片 ” 都 是 热 揪 拔 的 ， 就 像 拔 搬 显 卡 一 样 方便 ， 所 以 系统 可 了 
地 进行 替换 ， 并 且 将 维护 时 间 减 
少 到 最 小 。 这 种 集群 在 方便 管理 
的 同时 ， 也 节约 了 机 房 机 架 的 宝 
贵 空 间 ， 还 能 充分 利用 短 距 离 的 
高 性 能 通信 技术 ， 可谓 一 举 
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多 得 。 
图 7-10 所 示 为 两 种 典型 的 ” 革 呈 | 时 oy: 
群 安装 在 一 个 局 域 网 范围 内 ， 通 集中 摆 放 在 一 个 机 体积 如 同一 个 阵 
把 里 ， 兆 b 1 柜 ,可 忆 
常 由 一 个 GB 级 以 太 网 覆盖 ; 右 。 “J et 
边 的 属于 紧 耦 合集 群 ， 安 装 在 一 
个 机 架 中 ， 能 够 使 用 更 高 带宽 的 图 7-10 两 种 典型 的 集群 组 装 方式 


通信 技术 ， 而 且 有 很 高 的 电气 结 
合 度 ， 至 于 刀片 服务 器 慌 怕 就 要 更 紧凑 一 些 了 。 另 外 可 以 看 出 ， 这 两 个 集群 应 该 
都 是 专用 型 集群 。 

刀片 服务 带 在 设计 之 初 都 具有 低 功 耗 、 空 间 小 、 单 机 售 价 低 等 特点 ， 同 时 它 
还 继承 发 扬 了 传统 服务 器 的 一 些 技术 指标 ， 比 如 把 热 插 拔 和 宛 余 运 用 到 刀片 服务 
器 之 中 ， 这 些 设 计 满 足 了 密集 计算 环境 对 服务 器 性 能 的 需求 ; 有 的 还 通过 内 置 的 
负载 均衡 技术 ， 有 效 地 提高 了 服务 器 的 稳定 性 和 核心 网 络 性 能 。 而 从 外 表 看 ， 与 
传统 的 机 架 / 塔 式 服 务 顺 相 比 ， 刀 片 服务 融 能 够 最 大 限度 地 节约 服务 咒 的 使 用 空 
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间 和 费用 ， 并 为 用 户 提供 灵活 、 便 捷 的 扩展 升级 手段 。 

刀片 式 服务 器 已 经 成 为 高 性 能 计算 集群 的 主流 ， 在 全 球 500 强 和 国内 100 强 
超级 计算 机 中 ， 许 多 新 增 的 集群 系统 都 采用 了 刀片 架构 。 由 于 采用 刀片 服务 器 可 
以 极 大 减少 所 需 外 部 线 绕 的 数量 ， 可 以 大 大 降低 由 于 线 绕 连接 故障 带 来 的 隐患 ， 
提高 系统 可 靠 性 。 

4. 按照 控制 方式 分 类 

控制 方式 分 为 集中 控制 和 分 散 控制 两 种 。 采 用 集中 控制 的 集群 大 多 是 时 耦合 
集群 ， 出 于 空间 和 管理 便利 的 考虑 ， 人 允许 管理 员 集 中 控制 所 有 的 节点 ， 其 控制 界 
面 可 以 是 字符 终端 也 可 以 是 GUI。 用 于 并 行 计 算 的 Beowulf 集群 采用 的 就 是 集中 
控制 的 方式 ， 管 理 员 通过 shell 工具 或 者 X 接口 操纵 主 服务 器 ， 而 具体 的 计算 节 
点 是 不 可 直接 访问 的 。 

对 于 松 耘 合 的 集群 ， 采 用 分 散 和 集中 控制 混合 的 方法 。 由 于 在 松 耦 合 结构 上 
集中 控制 需要 特殊 的 系统 中 间 层 支持 ， 因 此 实现 的 难度 较 大 。 而 成 熟 的 管理 协议 
如 SNMP 等 就 可 用 于 该 环境 下 的 资源 分 配 和 调度 。 另 外 ， 在 松 耦 合 的 非 专用 集群 
如 “兼职 ”集群 中 ， 日 常 的 控制 仍 由 各 自 的 “ 属 主 ” 进 行 ， 而 闲 余 的 计算 时 间 
则 交 给 控制 器。 

5. 按照 同 构 性 分 类 

同 构 是 相对 的 ， 完 全 的 同 构 只 是 理论 模型 的 理想 化 。 在 各 类 分 布 式 系统 中 ， 
SMP 的 同 构 性 最 好 ， 直 接 反 映 在 单一 系统 映像 这 个 重要 的 指标 上 。 大 多 数 情况 
是 ,集群 节点 采用 相同 的 操作 系统 或 者 兼容 的 硬件 平台 ,以 尽 可 能 保证 二 进 制 代 
人 码 的 可 移植 性 。 比 如 Beowulf 集群 中 ， 集 群 节点 和 服务 需 采 用 的 都 是 Linux 核心 
操作 系统 ， 配 合 标准 的 PVM 和 MPI2 接口 ， 使 得 计算 任务 能 够 跨越 各 节点 的 地 址 
空间 ， 代 码 和 数据 表达 的 一 致使 之 在 节点 之 间 能 够 平滑 迁移 。 

异 构 特性 在 集群 的 发 展 中 日 益 重要 。 通 过 增强 的 0S 扩展 API 或 者 中 间 件 层 
软件 ， 任 务 可 以 在 异 构 的 节点 之 间 自 由 移动 ， 实 现 某 种 层次 上 的 SSI 能 力 。 在 负 
载 均 衡 环 境 和 可 用 性 支持 中 ， 一 定 程度 的 SSI 是 必须 的 。 但 是 ， 由 于 无 法 对 二 进 
制 的 代码 和 数据 结构 兼容 ， 必 然 采用 性 能 更 低 的 中 间 代 码 、 解 释 程 序 或 者 是 扩展 
动态 链接 库 来 实现 异 构 上 的 “ 同 构 ”，Java 语言 、PVM 并 行 库 都 在 这 一 领域 有 着 
很 好 的 应 用 。 随 着 WebService 和 XML 技术 的 发 展 ， 将 来 还 有 可 能 在 多 种 不 同 的 
编程 语言 、 运 行 环境 中 实现 令 人 满意 的 SSI 能 

6. 按照 安全 性 分 类 

安全 性 取决 于 集群 节点 与 外 界 的 互联 程度 。 如 果 和 集群 的 节点 不 论 是 物理 连接 
还 是 了 P 地 址 ， 都 是 暴露 在 外 的 ， 集群 内 部 的 通信 完全 没有 经 过 保护 ， 这 样 的 集 
群 系统 不 具备 安全 性 。 黑 客 或 者 恶意 用 户 的 破坏 都 会 造成 集群 的 不 可 用 。 不 过 这 
样 的 集群 由 于 在 规划 上 不 需 考虑 过 多 ， 比 较 容 易 实施 。 
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如 果 将 集群 节点 通过 防火 墙 等 保护 技术 隐蔽 起 来 ， 使 集群 内 部 的 节点 无 法 从 
外 部 非法 访问 ， 或 者 加 强 节 点 操作 系统 本 身 的 安全 能 力 ， 那 么 集群 系统 就 具备 一 
定 的 安全 性 。 因 为 要 考虑 安全 环境 的 诸多 因素 ， 也 必然 要 增加 构造 系统 的 难度 。 
目前 ， 大 多 数 商 业 集群 产品 要 么 使 用 专 有 的 内 部 通信 协议 来 实现 高 效 性 和 安全 
性 ， 要 么 与 现 有 的 安全 产品 进行 集成 ， 在 系统 或 者 网 络 协议 一 层 扩展 安全 功能 。 


7.4.6 集群 设计 的 四 大 要 素 


在 使 用 或 者 构造 一 个 集群 之 前 ， 首 先 根据 应 用 的 需求 ， 要 重点 分 析 以 下 几 个 
主要 问题 ， 这 些 问 题 并 非 互 相 独 立 ， 而 是 彼此 互相 影响 的 综合 因素 。 

1. 可 用 性 支持 

即 通常 所 说 的 HA (High Availability) 。 集 群 通过 宛 余 的 处 理 器 、 存 储 器 、 磁 
盘 、LO 设备 、 网 络 及 操作 系统 映像 等 ， 提 供 一 种 保持 成 本 有 效 的 高 可 用 性 。 为 
了 挖 所 这些 多 余 资 源 的 潜力 ， 需 要 使 用 一 些 技术 来 平滑 可 用 性 。 

从 关键 性 事务 /任务 计算 的 角度 看 ， 例 如 商用 服务 器 或 者 重要 的 数据 服务 器， 
集群 是 一 组 可 以 作为 单一 系统 管理 的 独立 服务 器 配置 ， 它 能 够 共享 名 字 空 间 ， 并 
且 设 计 成 可 以 容忍 节点 失效 以 及 支持 用 户 透明 访问 的 计算 资源 ， 其 重点 不 是 性 能 
而 是 高 可 用 性 。 

对 于 HA 在 不 同 的 应 用 领域 有 不 同 的 做 法 。 在 OLTP (联机 事务 处 理 ) 中 ， 
通常 使 用 联机 热 备 份 的 方式 来 解决 容错 问题 。 这 是 元 余 的 一 种 体现 ， 概 念 上 也 非 
常 简 单 : 在 主 系统 中 的 软 硬 件 失效 时 ， 重 要 的 应 用 程序 和 正在 处 理 的 任务 可 以 转 
移 到 “从 ”服务 器 上 ， 这 样 可 以 避免 故障 并 保证 服务 器 整体 可 用 性 。 该 过 程 也 
叫做 Failover (故障 屏蔽 ) ， 虽 然 会 暂时 降低 服务 器 的 性 能 ， 但 充分 保证 了 关键 
任务 的 正常 。 这 种 元 余 技 术 与 完全 履 盖 错误 部 件 的 组 件 级 元 余 技 术 不 同 ， 它 采用 
的 是 面向 集群 的 系统 级 元 余 ， 而 组 件 级 宛 余 为 了 保证 连续 服务 ， 往 往 采用 电气 手 
段 进行 硬件 上 的 替换 操作 。 

系统 级 容错 的 难点 在 于 进程 与 事务 迁移 ， 要 保证 在 线 事务 也 能 够 实时 容错 ， 
在 处 理 联 机 事务 的 这 一 层次 上 ， 就 有 必要 进行 进程 或 者 事务 迁移 的 工作 。 在 数据 
库 层 、0S 层 或 者 是 中 间 件 层 ， 都 有 不 同 厂商 的 针对 性 产品 来 实现 。Oracle 的 数 
据 库 产品 、IBM 的 操作 系统 和 中 间 件 产品 或 者 是 其 他 第 三 方 的 组 件 ， 都 有 对 HA 
不 同 程度 的 实现 。 

在 设计 健壮 、 高 可 用 性 的 系统 时 ， 以 下 三 项 要 同时 考虑 : 可 靠 性 、 可 用 性 及 
可 维护 性 (简称 RAS) 。 其 中 可 用 性 标准 最 令 人 感 兴 趣 ， 它 结合 了 可 靠 性 和 可 维 
护 性 两 个 概念 : 

可 靠 性 : 测量 在 没有 故障 的 情况 一 个 系统 能 工作 多 长 时 间 。 

可 用 性 : 一 个 系统 可 以 为 用 户 所 使 用 时 间 的 百分比 ， 即 正常 运行 时 间 的 百 
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分 比 。 

可 维护 性 ， 指 系统 是 否 易 于 维护 ， 包 括 人 硬件 和 软件 维护 、 维 修 和 升级 等 。 

系统 的 可 靠 性 可 表示 为 发 生 故 障 的 平均 时 间 ( Mean Time to Failure，MT- 
TF) ， 即 在 系统 (或 系统 的 一 个 部 件 ) 发 生 故 障 前 正常 运行 的 平均 时 间 。 可 维护 
性 指标 为 平均 故障 修复 时 间 (Mean Time to Repair，MTTR ) ， 即 用 于 修复 系统 和 
在 修复 后 将 它 恢复 到 工作 状态 所 用 的 平均 时 间 。 系 统 的 可 用 性 定义 为 : 可 用 性 = 
MTTF / (MTTF + MTTR ) 。 

提高 系统 的 可 用 性 基本 上 有 两 种 方法 : 增加 MTTF 或 减少 MTTR。 增 加 MT- 
TF 要 求 增加 系统 的 可 靠 性 。 计 算 机 工业 界 千方百计 地 制造 可 靠 性 系统 ， 如 今 工 
作 站 的 MTTF 范围 从 几 百 小 时 到 几 千 小 时 。 然 而 ， 再 进一步 提高 MTTF 非常 难 且 
花费 很 大 。 

集群 可 以 通过 减少 系统 的 MTTR 以 获得 可 用 性 ， 多 节点 集群 的 MTTR 低 于 一 
个 工作 站 ， 因 此 集群 可 靠 性 低 ， 比 工作 站 发 生 故 障 的 可 能 性 要 大 。 然 而 ， 如 果 能 
迅速 处 理 这 些 故障 就 可 提供 更 高 的 可 用 性 。 高 可 用 就 是 在 集群 发 生 故 障 时 能 够 快 
速 、 平 滑 切换 ， 保 证 系统 连续 运行 的 一 种 技术 。 

2. 单一 系统 映像 〈SSI) 

SSI 是 集群 系统 必 备 的 能 力 。 并 不 是 指 在 一 个 SMP 或 者 一 个 工作 站 中 ,， 仅 有 
唯一 的 一 份 系统 映像 驻 留 在 内 存 ， 而 是 指 从 使 用 者 的 感觉 上 看 ， 是 一 个 独立 的 、 
单一 的 计算 机 系统 。 那 么 ， 这 也 就 牵涉 到 使 用 者 是 谁 ， 使 用 目的 和 需求 是 什么 ， 
从 哪 一 个 层面 上 去 使 用 该 系统 等 问题 。SSI 的 基本 特征 大 致 如 下 : 

1) 单一 的 系统 : 理想 的 情况 是 ， 整 个 集群 看 上 去 就 是 一 个 多 处 理 机 ， 好 像 
一 台 巨 大 的 SMP 工作 站 。 这 一 点 与 分 布 式 系统 有 所 不 同 。 分 布 式 环境 中 ， 节 点 
的 利用 基本 属于 上 述 的 “兼职 ”状态 ， 参 与 并 行 任务 主要 通过 中 心 调度 器 进行 ， 
彼此 之 间 更 像 是 一 种 “协同 ”， 而 非 “ 统 一 ”; 同时 集群 作业 又 不 能 干扰 本 地 作 
业 的 正常 执行 。 因此， 在 “单一 ”能 力 的 表象 上 相对 较 弱 ， 甚 至 不 能 形成 真正 
的 SSI 能 力 。 

2) 单一 的 控制 人 口 : 逻辑 上 ， 对 集群 系统 的 管理 控制 应 该 是 在 一 个 明确 的 
位 置 进 行 。 所 有 的 管理 操作 行为 都 从 该 控制 入 口 (比如 一 台 专 用 的 监控 终端 ) 
进入 ,通过 任务 队列 的 排队 ， 请 求 集群 范围 内 的 软 硬 件 资源 并 适时 执行 。 单 一 控 
制 入 口 在 设计 集群 的 时 候 常常 被 认为 不 是 那么 重要 。 其 实 ， 缺乏 单一 控制 能 力 的 
集群 系统 只 会 使 得 管理 员 疲 于 奔 命 ， 忙 碌 于 节点 的 维护 和 作业 调度 的 手工 操作 
上 ， 使 整个 集群 成 为 一 个 “半自动 ”的 东西 。 

3) 对 称 能 力 : 类似 上 一 点 ， 如 果 集 群 允 许 用 户 从 不 同 的 节点 登入 的 话 ， 要 
求 用 户 获得 的 服务 能 力也 必须 相同 ， 没 有 任何 “歧视 ”。 因 此 ， 除 了 与 权限 、 管 
理 、 安 全 等 敏感 问题 有 关 的 功能 之 外 ， 所 有 的 功能 和 服务 都 是 对 等 的 。 
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4) 资源 访问 透明 : 应 该 说 ， 这 一 点 是 SSI 能 力 的 精华 所 在 。 在 使 用 集群 的 
时 候 ， 用 户 并 不 知道 为 其 服务 的 服务 器 具体 位 置 ， 所 有 的 操作 都 感觉 是 在 本 地 进 
行 的 。 尽 管 资 源 透 明 的 背后 或 许 是 一 定 程 度 的 性 能 降低 ， 但 是 从 方便 用 户 的 角度 
看 ， 无 需 处 理 繁杂 的 镜像 点 、 卷 、 域 等 定位 的 概念 ， 仅 有 一 个 根 、 一 个 进程 空 
间 、 一 个 人 地 址 、 一 个 0 资源 ， 那 必要 的 性 能 损失 还 是 划算 的 。 

不 难 发 现 ， 上 述 两 点 关于 HA 和 SSI 的 简单 叙述 其 实 隐 含 着 一 些 线 索 ， 将 这 
两 个 看 似 不 相干 的 特性 联系 在 一 起 。 如 果 没 有 一 定 的 SSI 能 力 ， 集 群 也 就 不 称 之 
为 集群 了 。 即 使 是 最 简单 的 联机 热 备份 系统 ， 不 管 是 在 正常 状态 还 是 进行 故障 接 
管 的 时 候 ， 所 体现 的 系统 “外 形 ”( 即 从 外 部 用 户 看 来 ) 既是 单一 的 系统 (虽然 
有 两 台 机 器 ) ， 又 能 提供 透明 的 平滑 的 服务 。 没 有 在 0S 或 者 更 高 层 实现 SSI 的 资 
源 统一 ， 是 无 法 做 到 这 种 高 可 用 能 力 的 。 可 以 说 ，SSI 是 集群 技术 的 基石 ,不仅 
为 高 可 用 的 需要 所 服务 ， 也 为 进一步 的 性 能 提高 工作 ， 因 此 ， 在 设计 集群 的 时 
候 ， 首 先 要 先进 行 考虑 的 就 是 SSI。 

3. 作业 管理 

作业 管理 主要 涉及 任务 派发 、 负 载 均 衡 和 并 行 处 理 等 功能 。 与 传统 工作 站 或 
PC 节点 不 高 的 利用 率 相 比 ， 集 群 要 达到 系统 的 高 利用 率 ， 作 业 管 理 软件 必须 提 
供 这些 功 能 。 那 么 ,在 作业 管理 具体 实现 中 ， 下 面 这 些 概念 就 显得 非常 重要 了 : 
什么 是 资源 ， 什 么 是 作业 ， 作 业 有 几 种 ， 如 何 衡量 负载 ， 作 业 的 运行 包含 哪些 状 
态 ， 每 个 状态 又 包含 哪些 元 素 等 ， 这 一 切 都 需要 在 集群 系统 中 定义 并 加 以 体现 。 
作业 管理 系统 设计 得 好 坏 ， 直 接 关系 到 集群 性 能 的 高 低 。 设 计 优 良 的 作业 管理 和 
调度 系统 ， 其 可 扩展 性 要 好 于 设计 一 般 的 集群 ， 其 影响 性 能 的 作用 远 远 高 于 其 他 
几 类 因素 。 

4. 高 效 通信 

为 集群 ， 特 别 是 松 耦 合 的 工作 站 集群 建立 一 个 高 效 的 通信 子 系统 比 为 紧 耦 合 
的 MPP 系统 建立 高 效 通 信子 系统 更 有 挑战 性 。 原 因 如 下 : 

1) 集群 有 更 高 的 节点 复杂 性 ， 集 群 节 点 不 能 像 MPP 节点 封装 得 那样 紧密 。 
而 松 耦 合 的 集群 应 用 相对 普遍 一 些 。 

2) 集群 内 节点 之 间 物 理 线路 的 长 度 要 长 于 MPP 节点 间 的 线路 长 度 。 即 使 是 
集中 式 的 集群 也 是 这 样 。 长 线路 导致 长 的 互联 网 络 延 时 。 但 更 重要 的 是 ， 长 线路 
有 更 多 的 可 靠 性 、 时 钟 扭 和 作 和 串 道 (cross-talking) 等 问题 。 这 些 问 题 要 求 用 可 
靠 的 和 安全 的 通信 协议 来 解决 ， 而 协议 又 会 增加 系统 开销 。 

3) 集群 一 般 使 用 有 标准 通信 协议 (如 TCP/IP) 的 商品 化 网 络 (如 以 太 网 、 
ATM) 。 商 品 化 部 件 一 般 遵 循 摩尔 定律 ， 但 TCP/IP 的 系统 开销 很 大 。 虽 然 低 级 
通信 协议 比 标准 通信 协议 有 效 ， 但 现在 没有 用 于 低级 通信 协议 的 统一 标准 。 
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追求 高 效 往往 与 集群 的 可 扩展 性 相抵 触 。 想 要 高 可 扩展 的 集群 系统 ， 就 要 使 
用 一 些 低 效率 的 商品 化 网 络 、 更 通用 的 硬件 平台 、 流 行 的 操作 系统 。 在 保障 了 集 
群 的 可 扩充 能 力 的 同时 ,不 可 避免 地 降低 了 优化 性 能 的 可 能 ， 采用 Open Source 
的 操作 系统 或 许可 以 解决 一 些 问题 。 

5. 理想 的 集群 模型 

与 OSI 标准 互联 参考 模型 一 样 ， 理 想 的 集群 只 在 概念 中 存在 ， 因 为 有 太 多 的 
制约 因素 左右 ， 实 现 起 来 就 不 太 可 能 了 。 但 不 妨 把 这 种 理想 结构 作为 研究 集群 的 
一 种 理论 基础 ， 有 助 于 对 现 有 集群 的 分 析 和 设计 时 的 借鉴 。 

从 图 7-11 可 以 看 出 ， 理 想 的 集群 支持 各 类 的 节点 ， 可 用 的 有 工作 站 、PC、 
SMP 服务 器 ， 甚 至 超级 计算 机 ， 节 点 的 操作 系统 是 多 用 户 、 多 任务 和 多 线程 的 
系统 ， 节 点 间 彼 此 可 以 是 同 构 甚 至 是 异 构 的 。 


并 行 编程 环境 用 户 接口 : GUI、 WEB 等 ,| 作业 调度 系统 或 者 OLTP 等 
(Java、C、PVM) 用 于 使 用 和 控制 其 他 子 系统 


单一 系统 映像 基础 设施 


系统 级 可 用 性 支持 


为 上 层 提 供 服务 的 特定 OS 扩展 或 者 中 间 件 层 



































集群 节点 集群 节点 
操作 系统 操作 系统 


千 兆 位 以 上 商品 化 互联 部 件 


SAN 存 储 区 域 网 络 一 致 的 分 布 式 内 存 访问 硬件 资源 


图 7-11 理想 的 集群 系统 ， 支 持 完全 的 SSI 和 HA 能 力 


节点 间 由 一 个 或 多 个 高 速 商品 化 网 络 互 联 。 这 些 网 络 使 用 标准 的 通信 协议 ， 
传输 速度 应 该 比 目 前 使 用 在 以 太 网 上 的 TCPZP 高 两 个 数量 级 。 商 品 化 网 络 不 但 
沟通 了 集群 节点 ， 完 成 必要 的 通信 功能 ， 而 且 也 为 实现 SAN (存储 区 域 网 络 ) 、 
一 致 的 分 布 式 WO、 一 致 的 内 存 访问 以 及 其 他 集群 硬件 资源 的 统一 访问 打下 基 
础 。 其 实 ， 网 络 仅 仅 是 物理 的 实现 ， 关 于 资源 的 控制 却 还 需 借助 操作 系统 来 
进行 。 

每 个 节点 的 网 络 接口 电路 与 节点 的 标准 LO 总 线 (如 PCI) 相连 ， 所 有 的 驱 
动 模块 都 是 可 热 插 拔 、 可 动态 加 载 的 。 当 人 处理 机 或 操作 系统 改变 时 ， 只 需 修 改 驱 
动 软件 并 重新 加 载 ， 不 必修 改 网 络 或 网 络 接 口 ， 也 不 必 重 新 启动 系统 。 

在 节点 工作 平台 上 有 一 组 与 工作 平台 相 独 立 的 软件 子 系统 ， 称 为 集群 操作 系 
统 ， 提 供 操作 系统 的 最 基本 的 核心 功能 。 操 作 系 统 之 上 是 特殊 的 扩展 或 者 中 间 件 
层 ， 用 于 为 HA 和 SSI 提供 必要 的 支持 。 
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中 间 件 层 之 上 是 提供 高 可 用 性 服务 的 可 用 性 子 系统 ， 还 有 一 个 单一 系统 映像 
层 能 提供 单一 的 用 户 和 人 口 点 、 单 一 的 文件 层次 结构 、 单 一 的 控制 点 以 及 高 效 的 作 
业 管 理 系 统 。 可 以 通过 编译 器 或 运行 时 间 库 技术 帮助 实现 单一 存储 器 ， 但 集群 不 
一 定 需要 支持 单一 进程 空间 。 

最 上 层 是 集群 的 管理 、 控 制 和 应 用 扩展 实现 层 ， 用 户 的 和 人口、 管理 员 的 控 
制 、 作 业 的 调度 都 在 这 一 层 具 体 实现 。 具 体 可 以 通过 SSI 提供 的 标准 API 或 者 动 
态 运 行 库 实现 。 此 外 ， 其 他 一 些 扩展 子 系统 也 在 该 层 实现 ， 比 如 分 布 式 的 OLTP 
(联机 事务 处理 ) 数据 库 。 




















7.5 双 机 与 集群 的 异同 


在 双 机 热 备 应 用 方面 ， 有 两 大 类 软件 产品 。 一 类 是 双 机 软件 (HA) ， 另 一 
类 则 称 作 集群 软件 ( Cluster) ， 这 两 类 软件 是 有 差异 的 。 

首先 ， 它 们 都 是 为 实现 系统 的 高 可 用 性 服务 的 ， 都 解决 了 一 台 服 务 器 出 现 故 
障 时 ， 由 其 他 服务 器 接管 应 用 的 问题 ， 从 而 持续 可 靠 地 提供 服务 的 问题 。 它 们 都 
是 通过 心跳 技术 进行 系统 检测 。 

区 别 在 于 ， 双 机 软件 只 能 支持 两 台 服 务 器 ， 以 主 从 方式 或 互 备 方式 工作 ; 而 
集群 软件 除了 支持 双 机 工作 外 ， 还 可 以 支持 多 人 台 服 务 需 (Multi Node) 工作 ， 同 
时 部 署 多 个 应 用 ， 并 在 多 个 服务 咒 间 灵活 地 设置 接管 策略 。 

在 两 种 情况 下 需要 使 用 集群 软件 : 一 是 有 超过 两 个 应 用 ， 本 身 就 需要 部 署 三 
台 或 更 多 的 服务 器 ; 二 是 只 有 两 个 应 用 ， 但 每 个 应 用 的 负载 均 较 大 ， 不 宜 采用 双 
机 互 备 的 方式 ， 而 是 需要 由 第 三 台 服 务 器 来 作为 这 两 个 应 用 的 备 机 。 

一 般 地 讲 ， 集 群 软件 具有 更 多 的 技术 含量 ， 具 备 更 高 的 可 靠 性 。 同 时 ， 往 往 
平均 到 每 台 服 务 顺 价格 也 高 于 双 机 软件 。 

在 选择 产品 时 ， 应 根据 应 用 的 实际 情况 来 确定 。 最 理想 的 方式 ， 则 是 在 应 用 
数量 少 、 负 载 不 是 很 大 时 先 使 用 双 机 软件 ， 然 后 在 应 用 数量 增多 、 负 载 增 大 时 平 
滑 过 渡 到 集群 软件 。 


7.6 负载 均衡 


ECM 系统 的 核心 部 分 ， 随 着 用 户 数 量 和 业务 量 的 增加 ， 其 数据 流量 和 计算 
强度 之 大 , 使 得 单一 设备 根本 无 法 承担 ， 而 如 何在 完成 同样 功能 的 多 个 网 络 设备 
之 间 实 现 合 理 的 业务 量 分 配 ， 使 之 不 至 于 出 现 一 台 设 备 过 忙 、 而 个 别 的 设备 却 未 
充分 发 挥 处 理 能 力 的 情况 ， 就 成 了 一 个 问题 ， 负 载 均 衔 技 术 也 因此 应 运 而 生 ， 双 
机 和 集群 系统 解决 方案 都 需要 负载 均衡 技术 来 实现 不 同 设备 之 间 的 负荷 分 担 。 
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7.6.1 负载 均衡 定义 


负载 均衡 建立 在 现 有 网 络 结构 之 上 ， 它 提供 了 一 种 廉价 、 有 效 、 透 明 的 方 
法 ,来 扩展 网 络 设备 和 服务 器 的 带宽 、 增 加 吞吐 量 、 加 强 网 络 数据 处 理 能 力 、 提 
高 网 络 的 灵活 性 和 可 用 性 。 负 和 载 均衡 有 两 方面 的 含义 : 首先 ， 大 量 的 并 发 访问 或 
数据 流量 分 担 到 多 台 节 点 设备 上 分 别处 理 ， 减 少 用 户 等 待 响 应 的 时 间 ; 其 次 ， 单 
个 重负 载 的 运算 分 担 到 多 台 节 点 设备 上 做 并 行 处 理 ， 每 个 节点 设备 处 理 结束 后 ， 
将 结果 汇总 ， 返 回 给 用 户 ， 系 统 处 理 能 力 得 到 大 幅度 提高 。 


7.6.2 负载 均衡 分 类 


目前 有 许多 不 同 的 负载 均衡 技术 用 以 满足 不 同 的 应 用 需求 ， 如 软 /硬件 负载 
均衡 、 本 地 /全 局 负载 均衡 、 更 高 网 络 层 负载 均衡 ， 以 及 链 路 聚合 技术 。 

软件 负载 均衡 解决 方案 ， 是 指 在 一 台 或 多 台 服 务 器 相应 的 操作 系统 上 ， 安 装 
一 个 或 多 个 附加 软件 来 实现 负载 均衡 。 它 的 优点 是 基于 特定 环境 、 配 置 简单 、 使 
用 灵活 、 成 本 低廉 ， 可 以 满足 一 般 的 负载 均衡 需求 。 

硬件 负载 均衡 解决 方案 ， 是 直接 在 服务 顺和 外 部 网 络 间 安 装 负载 均衡 设备 ， 
这 种 设备 通常 称 之 为 负载 均衡 器 。 由 于 专门 的 设备 完成 专门 的 任务 ， 独 立 于 操作 
系统 ， 整 体 性 能 得 到 大 量 提高 ， 加 上 多 样 化 的 负载 均衡 策略 、 智 能 化 的 流量 管 
理 ， 可 达到 最 佳 的 负载 均衡 需求 。 一 般 而 言 ， 硬 件 负载 均衡 在 功能 、 性 能 上 优 于 
软件 方式 ， 不 过 成 本 昂贵 。 

本 地 /全 局 负载 均衡 : 负载 均衡 从 其 应 用 的 地 理 结构 上 ， 分 为 本 地 负载 均衡 
和 全 局 负载 均衡 。 本 地 负载 均衡 是 指 对 本 地 的 服务 器 群 间 做 负载 均衡 ， 全 局 负载 
均衡 是 指 在 不 同 地 理 位 置 、 有 不 同 网 络 结构 的 服务 器 群 间 做 负载 均衡 。 本 地 负载 
均衡 能 有 效 地 解决 数据 流量 过 大 、 网 络 负 从 过 重 的 问题 ， 并 且 不 需 花 费 蝇 贵 开 文 
购置 性 能 卓越 的 服务 器 ， 可 充分 利用 现 有 设备 ， 避 免 服务 器 单 点 故障 造成 数据 流 
量 的 损失 。 有 灵活 多 样 的 均衡 策略 ， 可 把 数据 流量 合理 地 分 配给 服务 器 群 内 的 服 
务 需 ,来 共同 负担 。 即 使 是 再 给 现 有 服务 需 扩 充 升级 ， 也 只 是 简单 地 增加 一 个 新 
的 服务 器 到 服务 群 中 ， 而 不 需 改 变现 有 网 络 结构 、 停 止 现 有 的 服务 。 全 局 负载 均 
衡 ， 主 要 用 于 在 一 个 多 区 域 拥 有 自己 服务 器 的 站 点 ， 为 了 使 全 球 用 户 只 以 一 个 
IP 地 址 或 域名 承 能 访问 到 离 自己 最 近 的 服务 器 ， 从 而 获得 最 快 的 访问 速度 ， 也 
可 用 于 子 公司 分 散 站 点 分 布 广 的 大 公司 通过 Intranet (企业 内 部 互联 网 ) 来 达到 
资源 统一 合理 分 配 的 目的 。 

更 高 网 络 层 负载 均衡 : 针对 网 络 上 人 负载 过 重 的 不 同 瓶 贷 所 在 ， 从 网 络 的 不 同 
层次 入 手 ， 我 们 可 以 采用 相应 的 负载 均衡 技术 来 解决 现 有 问题 。 更 高 网 络 层 负载 均 
衡 ,通常 操作 于 网 络 的 第 四 层 或 第 七 层 。 第 四 层 负载 均衡 将 一 个 Intemet 上 合法 注 
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册 的 IP 地 址 映射 为 多 个 内 部 服务 器 的 卫 地 址 ， 对 每 次 TCP 连接 请 求 动态 使 用 其 中 
一 个 内 部 PP 地 址 ， 达 到 负载 均衡 的 目的 。 第 七 层 负 载 均衡 控制 应 用 层 服务 的 内 容 ， 
提供 了 一 种 对 访问 流量 的 高 层 控制 方式 ， 适 合 对 HITP 服务 器 群 的 应 用 。 第 七 层 负 
载 均 衡 技术 通过 检查 流 经 的 HITP 报头 ， 根 据 报头 内 的 信息 来 执行 负载 均衡 任务 。 


7.6.3 负载 均衡 的 实现 方法 


对 一 个 网 络 的 负载 均衡 应 用 ， 可 以 从 网 络 的 不 同 层次 入 手 ， 具 体 情 况 要 看 对 
网 络 瓶颈 所 在 之 处 的 具体 情况 进行 分 析 。 一 般 来 说 ， 企 业内 容 管理 系统 的 负载 均 
衡 大 体 上 都 从 传输 链 路 聚合 、 采 用 更 高 层 网 络 交换 技术 和 设置 服务 器 集群 策略 三 
个 角度 实现 。 

链 路 聚合 : 企业 内 部 对 高 带宽 应 用 需求 不 断 增 大 时 (例如 Web 访问、 文档 
传输 及 内 部 网 连接 ) ， 局 域 网 核心 部 位 的 数据 接口 将 产生 瓶颈 问题 ， 因 此 延长 了 
客户 应 用 请 求 的 响应 时 间 。 通 常 ， 解 决 瓶 颈 问题 采用 的 对 策 是 提高 服务 器 链 路 的 
容量 ， 使 其 满足 目前 的 需求 。 例 如 可 以 由 快速 以 太 网 升级 到 千 兆 以 太 网 。 对 于 大 
型 网 络 来 说 ， 采 用 网 络 系统 升级 技术 是 一 种 长 远 的 、 有 前 景 的 解决 方案 。 链 路 聚 
合 系统 增 加 了 网 络 的 复杂 性 ， 但 也 提高 了 网 络 的 可 靠 性 ， 使 人 们 可 以 在 服务 器 等 
关键 局 域 网 段 的 线路 上 采用 宛 余 路 由 。 对 于 计算 机 局 域 网 系统 ， 可 以 考虑 采用 虚 
拟 路 由 宛 余 协议 (VRRP) 。VRRP 可 以 生成 一 个 虚拟 默认 的 网 关 地 址 ， 当 主 路 由 
器 无 法 接 通 时 ， 备 用 路 由 器 就 会 采用 这 个 地 址 ， 使 局 域 网 通信 得 以 继续 。 总 之 ， 
当 必 须 提 高 主要 线路 的 带宽 而 又 无 法 对 网 络 进行 升级 的 时 候 ， 便 可 以 采用 链 路 聚 
合 技术 。 

适合 大 型 网 络 的 高 层 交 换 : 大 型 网 络 一 般 都 是 由 大 量 专用 技术 设备 组 成 的 ， 
如 包括 防火 墙 、 路 由 器 、 第 二 /三 层 交 换 机 、 负 载 均 衡 设 备 、 组 冲服 务 器 和 Web 
服务 器 等 。 如 何 将 这 些 技术 设备 有 机 地 组 合 在 一 起 ， 是 一 个 直接 影响 到 网 络 性 能 
的 关键 性 问题 。 大 型 网 络 的 核心 交换 机 一 般 采 用 高 端的 机 柜 式 交换 机 ， 现 在 这 类 
交换 机 一 般 都 提供 第 四 层 交 换 功 能 ， 可 以 将 一 个 外 部 IP 地 址 映射 为 多 个 内 部 IP 
地 址 ， 对 每 次 TCP 连接 请 求 动态 使 用 其 中 一 个 内 部 地 址 ， 达 到 负载 均衡 的 目的 。 
有 的 协议 内 部 支持 与 负载 均衡 相关 的 功能 ， 例 如 HTTP 中 的 重 定向 能 力 、Web 内 
容 交换 技术 ， 即 URL 交换 或 七 层 交换 技术 ， 提 供 了 一 种 对 访问 流量 的 高 层 控制 
方式 。Web 内 容 交 换 技 术 检 查 所 有 的 HTTP 报头 ， 根 据 报头 内 的 信息 来 执行 负载 
均衡 的 决策 ， 并 可 以 根据 这 些 信息 来 确定 如 何 为 个 人 主页 和 图 像 数 据 等 内 容 提供 
服务 。 它 不 是 根据 TCP 端口 号 来 进行 控制 的 ， 所 以 不 会 造成 访问 流量 的 滞留 。 
如 果 Web 服务 器 已 经 为 诸如 图 像 服务 、SSL 对 话 和 数据 库 事 务 服 务 之 类 的 特殊 
功能 进行 了 优化 ,那么 ， 采 用 这 个 层次 的 流量 控制 将 可 以 提高 网 络 的 性 能 。 目 
前 ， 采 用 高 层 交 换 技 术 的 产品 与 方案 ， 有 许多 专用 的 设备 ， 如 3Com 公司 的 
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3Com SuperStack3 服务 器 负载 均 衔 交换 机 和 Cisco 系统 公司 的 CSS 交换 机 产品 等 ， 
内 的 服务 需 广 商 如 联想 和 浪潮 等 也 都 有 专用 的 负载 均衡 产品 。 

华 均 衡 策 略 的 服务 器 集群 : 随 着 企业 规模 的 扩大 ， 网 上 访问 量 会 明显 增加 。 
企业 的 日 党 经 营 和 各 种 办 公 业 务 都 往 上 迁移 ， 所 传送 的 不 仅 是 一 般 的 文本 信息 ， 
还 有 很 多 视频 和 语音 。 在 这 种 情况 下 ， 势 必 也 会 产生 大 量 并 发 访问 ， 因 此 要 求 网 
络 中 心服 务 器 必须 具备 提供 大 量 并 发 访问 服务 的 能 力 。 这 样 ， 网 络 中 心服 务 器 的 
处 理 能 力 和 1/0 能 力 已 经 成 为 提供 服务 的 瓶颈 。 如 果 客 户 的 增多 导致 通信 量 超出 
了 服务 需 能 承受 的 范围 ， 那 么 其 结果 必然 是 宕 机 。 早 期 的 服务 央 集 群 通常 以 光纤 
镜像 卡 进行 主 从 方式 备份 。 通 过 LSNAT (Load Sharing Network Address Transfer， 
负载 分 担 网 络 地 址 转换 ) 将 多 人 台 服 务 需 网 卡 的 不 同 IP 地 址 翻译 成 一 个 虚拟 IP 地 
址 ， 使 得 每 台 服 务 需 均 时 刻 处 于 工作 状态 。 原 来 需要 用 小 型 机 来 完成 的 工作 改 由 

台 PC 服务 器 完成 ， 这 种 弹性 解决 方案 对 投资 保护 的 作用 是 相当 明显 的 ， 既 避 
免 了 小 型 机 刚性 升级 所 带 来 的 巨大 设备 投资 ， 又 避免 了 人 员 培 训 的 重复 投资 。 同 
时 ， 企 业 可 以 依据 业务 的 需要 随时 调整 服务 器 的 数量 。 


7.6.4 负载 均衡 的 网 络 结构 


负载 均衡 的 网 络 设 计 结构 为 对 称 结构 ， 在 对 称 结构 中 每 台 服 务 器 都 具备 等 价 
的 地 位 ， 都 可 以 单独 对 外 提供 服务 ， 而 无 须 其 他 服务 器 的 辅助 。 然 后 ， 可 以 通过 
某 种 技术 ， 将 外 部 发 送 来 的 请 求 均匀 分 配 到 对 称 结构 中 的 每 台 服 务 器 上 ， 接 收 到 
连接 请 求 的 服务 器 都 独立 回应 客户 的 请 求 。 在 这 种 结构 中 ， 由 于 建立 内 容 完全 一 
致 的 Web 服务 器 并 不 困难 ， 因 此 负载 均衡 技术 就 成 为 建立 一 个 高 负载 Web 站 点 
的 关键 性 技术 。 综 上 所 述 ， 在 客户 端 对 操作 系统 进行 优化 ， 改 善 网 络 环境 ， 虽 然 
可 以 最 大 限度 地 提高 客户 端的 信息 传输 速率 ， 但 是 ， 在 网 络 中 ， 当 众多 工作 站 同 
时 向 同一 服务 器 发 出 请 求 或 同时 访问 同一 个 文件 时 ， 所 产生 的 信息 传输 阻塞 现象 
却 是 无 能 为 力 的。 为 此 在 服务 器 采用 负载 均衡 这 种 策略 ， 它 能 让 多 人 台 服 务 器 或 多 
条 链 路 共同 承担 一 些 繁 重 的 计算 或 0 任务 ， 从 而 以 较 低 成 本 消除 网 络 瓶 顶 ， 避 
免 了 单机 拥塞 或 单机 故障 造成 的 不 良 影响 ， 便 于 扩展 ， 保 证 服务 需要 ， 提 高 网 络 
的 灵活 性 和 可 靠 性 。 而 且 负 载 均衡 是 建立 在 现 有 网 络 结构 之 上 ， 提 供 了 一 种 廉价 
有 效 的 方法 扩展 服务 器 带宽 和 增加 否 吐 量 ， 加 强 网 络 数 据 处 理 能 力 ， 提 高 网 络 的 
灵活 性 和 可 用 性 。 


7.6.5 负载 均衡 的 优越 性 


网 络 负载 均衡 提高 了 诸如 Web 服务 器 、FTP 服务 器 和 其 他 关键 任务 服务 器 
上 的 Internet 服务 器 程序 的 可 用 性 和 可 伸缩 性 。 单 一 服务 器 可 以 提供 有 限 级 的 可 
靠 性 和 可 伸缩 性 。 但 是 ， 通 过 将 2 个 或 2 个 以 上 高 级 服务 器 的 主机 连 成 集群 ， 网 
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络 负载 均衡 就 能 够 提供 关键 任务 服务 器 所 需 的 可 靠 性 和 性 能 。 为 了 建立 一 个 高 负 
载 的 Web 站 点 ， 必 须 使 用 多 服务 咒 的 分 布 式 结构 。 如 使 用 代理 服务 器 和 Web 服 
务 絮 相 结 合 ,或 者 两 台 Web 服务 顺 相 互 协 作 ， 这 种 方式 也 属于 多 服务 天 的 结构 。 
但 在 这 些 多 服务 器 的 结构 中 ， 每 台 服 务 器 所 起 到 的 作用 是 不 同 的 ， 属 于 非 对 称 的 
体系 结构 。 非 对 称 的 服务 器 结构 中 每 台 服 务 顺 起 到 的 作用 是 不 同 的 ， 例 如 一 台 服 
务 絮 用 于 提供 静态 网 页 ， 而 为 一 全 用 于 提供 动态 网 页 等 。 这 样 就 使 得 网 页 设计 时 
就 需要 考虑 不 同 服务 咒 之 间 的 关系 。 一 旦 要 改变 服务 器 之 间 的 关系 ， 就 会 使 得 某 
些 网 页 出 现 连 接 错 误 ， 不 利于 维护 ， 可 扩展 性 也 较 差 。 

总 之 ， 使 用 负载 均衡 技术 ， 可 以 达到 下 列 优点 : 

1) 解决 网 络 拥塞 问题 ， 就 近 提供 服务 实现 地 理 位 置 无 关 性 。 

2) 为 用 户 提供 更 好 的 访问 质量 。 

3) 提高 服务 器 响应 速度 。 

4) 提高 服务 器 及 其 他 资源 的 利用 效率 。 
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FileNet 公司 是 一 家 专门 提供 企业 内 容 管理 解决 方案 的 公司 。FileNet 公司 在 
全 球 金融 及 大 型 企业 的 内 容 管理 及 流程 管理 产品 市 场 份 额 占 到 30%， 产 品 占 有 
率 高 、 管 理 效率 好 ， 深 受 业 界 的 好 评 。2006 年 8 月 ，IBM 公司 斥 16 亿美 元 巨 资 
收购 了 FileNet 公司 。 





8.1 FileNet P8 


Fielnet P8 是 IBM 公司 新 一 代 企 业 级 内 容 和 流程 管理 平台 ， 是 经 过 了 20 多 年 
产品 发 展 基础 之 上 的 新 产品 ， 它 在 分 布 式 、 可 获取 性 、 可 调控 性 、 安 全 、 标 准 化 
等 诸多 方面 都 有 很 强 的 表现 ， 在 业界 具有 很 高 的 评价 ， 尤 其 是 在 P8 平台 下 内 容 
管理 和 业务 流程 管理 产品 的 无 颖 结合 ， 为 用 户 提 供 业 务 文档 、 影 像 和 流程 的 管 
理 ， 提 供 了 全 球 领先 的 影像 存储 和 业务 流程 管理 集成 的 环境 。 


8.1.1 FileNet P8 技术 特性 


FileNet P8 基于 技术 标准 而 设计 ， 平 台中 利用 标准 技术 来 保障 系统 的 整体 能 
力 ， 如 JAAS 等 提供 用 户 的 认证 和 授权 机 制 ， 可 以 快速 实现 企业 IT 系统 的 单 点 登 
录 ， 利 用 JCA 技术 保障 系统 的 交易 完整 性 ， 通 过 EJB 和 Web Service 提供 对 外 
服务 。 

FileNet P8 旨 在 加 速 企 业内 容 管理 部 署 和 业务 过 程 的 自动 化 ， 它 从 以 下 一 些 
技术 方面 实现 目标 : 

1) FileNet P8 采用 一 种 可 缩放 、 高 性 能 、 统 一 的 元 数据 与 目录 模型 ， 用 于 
对 内 容 与 过 程 的 管理 及 满足 依 规 性 要 求 。 该 平台 带 有 一 个 重新 构造 的 高 度 可 缩放 
的 JEE 内 容 引 擎 ， 它 为 复杂 文档 的 管理 以 及 精简 、 编 著 、 翻 译 、 审 查 和 发 表 过 
程 提 供 了 一 种 丰富 的 复合 文档 模型 ， 这 将 使 机 构 能 够 动态 地 发 布 准确 、 一 致 、 贴 
切 和 高 效 的 文档 。 

2) FileNet P8 平台 设计 用 来 使 企业 能 够 实时 跟踪 、 监 控 、 量 度 和 优化 业务 
过 程 ， 从 而 快速 判断 运营 瓶 人 席 ， 并 精细 调整 过 程 以 达到 最 佳 效果 。 男 外 ， 新 的 过 
程 设计 功能 也 增强 了 商务 用 户 的 动手 能 力 ,减少 了 对 全 部 门 的 依赖 。 

3) FileNet P8 还 在 支持 其 业务 过 程 框架 方面 提供 了 新 的 改进 功能 ， 该 框架 
设计 用 来 显著 降低 应 用 的 部 署 成 本 和 面市 时 间 ， 使 客户 和 伙伴 能 够 加 快 以 内 容 和 
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过 程 为 中 心 的 应 用 开发 与 部 署 。 新 功能 文 持 大 量 可 配置 用 户 界 面 的 快速 开发 ， 使 
用 户 能 够 迅速 而 简便 地 创建 一 种 定制 的 外 观 与 感觉 。 

4) FileNet P8 还 支持 业务 过 程 模型 标注 ， 这 是 一 个 标准 化 的 图 形 标注 方法 ， 
用 于 记录 和 描述 业务 过 程 。 通 过 使 用 业务 过 程 模型 标注 ， 机 构 可 以 跨越 其 边界 来 
更 好 地 交流 过 程 设 计 ， 并 且 更 好 地 满足 法 规 符合 性 要 求 。 

5) FileNet P8 提供 全 球 多 语言 处 理 支 持 ， 用 于 识别 终端 用 户 设 置 ， 并 用 接 
收 和 人 的 母语 提供 信息 。 这 一 功能 有 利于 采用 外 包 的 公司 ， 或 那些 正在 向 新 的 地 区 
市 场 扩 张 的 公司 ， 对 于 必须 满足 双语 支持 法 定 要 求 的 机 构 也 至 关 重 要 。 

6) FileNet P8 文 持 FileNet 的 依 规 性 组 件 ， 它 包括 FileNet 记录 管理 、FileNet 
邮件 管理 和 FileNet 记录 疏 虫 器 。 其 中 ，FileNet 记录 疏 虫 器 可 以 创建 位 于 FileNet 
P8 以 外 的 重要 文档 ， 并 使 之 在 业务 过 程 中 扮演 重要 角色 ， 使 公司 能 够 有 效 地 管 
理 网 络 文 件 共 享 位 置 上 的 大 批量 文件 ， 提 高 对 记录 管理 与 法 规 要 求 的 符合 性 。 

FileNet P8 还 提供 对 第 三 方 数 据 库 的 “内 容 联 合 服 务 ”， 实 现在 企业 范围 内 
搜索 、 编 目 、 分 类 、 保 护 、 更 新 和 删除 内 容 。FileNet P8 还 能 够 支持 联合 标注 ， 
如 以 电子 形式 出 现 的 “即时 贴 ”、 橡 皮 图 章 和 注释 等 。 

FileNet P8 的 核心 部 分 是 为 企业 用 户 提 供 基本 模块 的 系统 平台 ,包括 内 容 引 
擎 、 流 程 引 擎 、 应 用 引擎 和 转换 引擎 。 这 些 组 成 模块 适应 企业 内 容 管理 和 业务 流 
程 管理 的 基本 需求 ， 其 他 模块 是 可 选 的， 可 添加 到 系统 中 以 实现 相应 的 附加 功 
能 。 平 台 的 底层 是 用 于 存 取 整 个 企业 内 容 的 内 容 联合 能 力 。 另 外 ，FileNet P8 系 
统 还 根据 客户 的 需求 可 以 选择 记录 管理 、 电 子 表单 、 电 子 邮 件 管理 、 捕 获 、 路 程 
分 析 器 、 流 程 模拟 器 。 

作为 一 个 开放 式 的 平台 ，FileNet P8 以 内 容 管 理 平 台 、 流 程 管理 平台 为 核心 ， 
使 企业 能 够 捕获 、 存 储 、 管 理 、 保 护 和 处 理 信 息 ， 提 高 操作 效率 ， 降 低 总 体 拥有 
成 本 。 同 时 ，FileNet P8 使 客户 将 业务 流程 流畅 化 、 自 动 化 ， 访 问 并 管理 所 有 形 
式 的 内 容 ， 实 现 记录 管理 自动 化 ， 并 满足 合 规 性 的 需要 。 


8. 1. 2 FileNet P8 内 容 引 擎 


内 容 管 理 系 统 的 核心 在 PileNet P8 中 通常 被 称 为 内 容 引 擎 。 内 容 引 擎 提供 管 
理 企业 内 容 和 客户 自 定义 业务 对 象 的 存储 管理 服务 ，P8 内 容 引擎 设计 用 来 处 理 
具有 大 量 需求 的 大 型 企业 ， 具 有 管理 整个 企业 的 工作 对 象 、 自 定义 对 象 和 文件 的 
能 力 ， 并 提供 了 强大 的 和 易于 使 用 的 系统 管理 工具 ， 管 理 范围 广泛 的 企业 内 容 和 
对 象 ， 包 括 影像 、 电 子 文档 、Web 内 容 、 记 录 文 件 夹 、 工 作 流 定义 、 存 储 搜寻 、 
发 布 模板 、 登 录 模板 、 分 析 报 告 和 模拟 情节 。 

P8 内 容 引擎 功能 结构 组 件 如 下 : 

1) 内 容 引擎 服务 : 接收 传人 的 请 求 ， 创 建 、 更 新 和 检索 对 象 ， 如 文件 、 文 
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件 夹 和 业务 。 

2) 内 容 引擎 传输 : 内 容 引 擎 服务 提供 了 两 个 传输 机 制 EJB 和 Web Serv- 
ices; 应 用 程序 可 以 使 用 它 来 访问 内 容 引擎 服务 器 。 

3) 企业 管理 : 包含 一 个 微软 管理 控制 台 管 理 单元 中 的 应 用 ， 用 来 管理 内 容 
引擎 服务 和 对 象 。 

4) Net API 和 Java API: 提供 基于 . Net 平台 和 Java 平台 的 API。 

内 容 引擎 包含 的 服务 模块 如 下 : 

1) 对 象 存储 服务 : 管理 一 个 或 者 更 多 对 象 存储 所 需 的 数据 库 事务 ， 一 个 对 
象 存储 是 存储 对 象 (如 文档 、 文 件 夹 或 业务 对 象 ) 和 定义 对 象 类 的 元 数据 的 容 
器 。 对 象 库 中 的 每 个 对 象 都 关联 到 一 个 类 ， 该 类 是 创建 对 象 用 的 模板 或 者 定义 ， 
通过 这 个 模板 或 定义 ， 指 定 属性 (元 数据 ) 行为 和 用 到 该 对 象 的 安全 性 。 一 个 
对 象 存储 服务 ， 能 对 FileNet P8 域 里 的 多 个 对 象 存储 进行 存 取 。 而 且 一 个 对 象 存 
储 服务 的 所 有 实例 对 于 FileNet P8 域内 的 所 有 对 象 存 储 器 都 是 可 用 的 。 

2) 库 服 务 ， 包 括 文档 版 本 控制 、 自 动 内 容 分 类 、 文 档 生 命 周 期 管理 和 元 数 
据 管理 ， 具 体内 容 如 下 : 

@ 内 容 相关 服务 ， 即 文件 内 容 管理 组 件 的 逻辑 集合 ， 对 象 存储 服务 与 这 些 
组 件 互动 来 进行 内 容 的 读 、 写 和 全 文本 索引 。 

@ 文件 存储 服务 ， 管 理 一 个 或 者 多 个 存储 内 容 的 文件 存储 器 ， 对 象 存储 服 
务 与 文件 存储 服务 沟通 ， 把 新 内 容 加 入 内 容 存储 器 。 

@) 索引 服务 ， 管 理 与 验证 全 文本 搜索 引擎 的 互动 ， 通 过 文件 存储 服务 ， 将 

后 








索引 信息 存储 到 文件 系统 。 

@@) 内 容 缓 存 服务 ， 本 服务 被 激活 后 ， 系 统 可 将 内 容 缓存 到 本 地 ， 供 
调 阅 。 

3) 发 布 PDF 插件 和 HTML 服务， 处 理 将 文档 转换 成 Adobe Acrobat PDF 格 
式 或 者 HTML 格式 的 请 求 ， 将 格式 转换 成 请 求 提交 给 转换 引擎 。 

4) 流程 路 由 器 ， 转 发 请 求 给 某 个 虚拟 机 服务 和 流程 引擎 上 的 隔离 区 域 ， 虚 
拟 机 服务 是 独特 的 工作 流 系统 ， 决 定 用 户 能 访问 的 数据 库 和 服务 器 。 流 程 路 由 器 
安装 在 内 容 引 擎 服务 器 上 ， 支 持 来 自 工作 流 订阅 的 工作 流 的 自动 激活 ， 流 程 路 由 
器 也 可 以 转发 Web Service 请 求 到 流程 引擎 。 

5) COM API， 提 供 一 个 基于 COM 的 编程 接口 ， 并 用 于 事件 脚本 。 

6) Java API SOAP 监听 程序 ， 接 受 由 内 容 Java API 调用 产生 的 一 串 请 求 ， 将 
数据 送 给 COM API。 监 听 程 序 确定 与 对 象 进行 通信 的 COM 接口 和 方式 ， 以 及 被 
调用 的 方式 ， 调 整 被 传递 参数 的 有 效 性 ， 安 排 调 用 引起 的 “OUT” 参数 返回 。 

7) WebDAV 提供 者 ， 内 容 引擎 的 ISAPI 扩展 ， 让 使 用 者 能 够 创建 并 编辑 文 
档 ， 通 过 WebDAYV 兼容 应 用 程序 ， 如 微软 的 Word 或 者 DreamWeaver 管理 内 容 引 
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擎 上 的 文件 。 

8) CE 和 PE 网 络 服务 ， 实 现 通过 网 络 访问 内 容 和 流程 的 功能 ， 内 容 和 流程 
的 Web Services API 为 开发 者 提供 一 套 完整 的 接口 ， 它 支持 网 络 环境 下 的 客户 应 
用 开发 。 

9) 企业 管理 程序 ， 微 软 管理 控制 台 插件 应 用 程序 软件 ， 用 户 通过 它 管理 内 
容 引擎 服务 和 对 象 存 储 器 。 管 理 人 员 能 实现 创建 并 管理 对 象 存储 器 、 文 件 存 储 
器 ， 管 理 ileNet P8 的 域名 等 级 服务 ， 处 理 类 、 属 性 、 安 全 策略 、 生 命 周期 策略 
和 事件 订阅 ， 执 行文 件 检 入 和 检 出 等 文档 管理 任务 。 


8. 1. 3 ”FileNet P8 流程 引擎 


流程 引擎 为 管理 业务 流程 〈 也 称 为 工作 流 ) 的 各 个 环节 提供 软件 服务 ， 如 
流程 执行 、 流 程 路 由 安排 、 规 则 管理 、 过 程 模拟 和 建 模 以 及 工作 流程 分 析 。 流 程 
引擎 组 件 允 许 用 户 创建 、 修 改 和 管理 工作 流程 执行 的 应 用 、 企 业 用 户 或 者 外 部 用 
户 〈 如 合作 伙伴 和 客户 ) 实现 的 工作 流 。 

流程 引擎 包含 下 列 服务 和 管理 模块 

1) 规则 引擎 连接 框架 : 基于 一 组 已 定义 的 规则 ， 控 制 工作 流 操作 ， 程 序 设 
计 者 或 业务 分 析 者 使 用 规则 引擎 创 建 软 件 ， 创 建 业 务 规则 ， 并 将 规则 和 工作 流 的 
各 步骤 连接 起 来 。 当 一 个 执行 中 的 工作 流 遇 到 一 条 规则 时 ， 流 程 引擎 将 请 求 送 给 
规则 精灵 ， 后 者 运行 规则 组 中 的 规则 ， 并 将 结果 反馈 给 流程 引 警 。 

2) 电子 邮件 通知 : 当 指定 的 流程 相关 事件 发 生 时 ， 自 动 发 电子 邮件 给 使 用 
者 ， 电 子 邮件 通知 也 能 做 工作 流 跟 踪 。 

3) 流程 服务 : 代表 流程 引擎 提供 工作 流 服务 。 

4) 流程 任务 管理 : 在 应 用 引擎 、 流 程 引 擎 、 流 程 模 拟 上 运行 ， 为 ileNet P8 
平台 的 各 种 软件 功能 〈 如 流程 服务 ) 、 流 程 模拟 器 提供 管理 工具 ， 启 动 或 者 停止 
服务 ， 以 及 定义 路 由 的 各 种 工具 。 

5) 流程 分 析 连 接 需 : 提供 链接 服务 ， 指 定 从 流程 引擎 到 流程 分 析 软 件 的 数 
据 路 径 。 这 个 连接 器 收集 关于 流程 执行 情况 的 数据 ， 并 对 流程 分 析 软 件 进行 
输入 。 


8.1.4 FileNet P8 应 用 引擎 


应 用 引擎 是 主导 Web 应 用 、Java Applets、 流 程 引 苟 路 由 硕 和 应 用 开发 工具 
的 平台 组 件 ， 是 流程 和 内 容 的 表示 层 。 应 用 引擎 为 Workplace 和 内 容 引擎 间 进 行 
的 用 户 身 份 识别 提供 保护 ， 并 在 已 配置 的 前 提 下 提供 SSL 安全 措施 。 

应 用 引擎 包括 的 服务 和 应 用 如 下 : 

1) Workplace: 这 是 一 个 终端 用 户 的 网 络 应 用 软件 ， 为 文件 管理 提供 存 取 功 
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能 并 与 FileNet P8 的 业务 流程 管理 功能 紧密 结合 。Workplace 支持 扩展 的 FileNet 
P8 功能 ， 如 表单 管理 、 记 录 管 理 和 门户 等 。Workplace 使 用 FileNet Web 应 用 工 
具 包 构建 ， 并 在 JPEE 应 用 服务 器 上 的 Web 容器 内 运行 。Workplace 利用 XSL 转 
换 很 多 用 户 界 面 元 件 ， 如 查询 结果 和 文件 夹 内 容 。 而 且 提供 的 大 部 分 功能 是 基于 
HTML 的 ， 即 能 在 任意 平台 、 配 合 众 多 的 浏览 器 产品 运行 ， 高 度 图 形 化 的 高 级 功 
能 通过 Java Applet 的 形式 来 提供 流程 设计 器 、 流 程 配 合 控 制 台 、 流 程 管理 员 、 
场景 设计 、 搜 索 设计 和 发 布设 计 等 功能 。 

2) Office 无 颖 集成 : 使 用 户 在 FileNet P8 内 容 库 内 轻松 管理 Office 文档 和 
Outlook 邮件 信息 。 用 户 可 以 直接 从 0fhce 目录 中 存储 、 搜 索 和 检索 文档 、 邮 件 
和 附件 。 除 了 保护 和 转换 0ffice 文档 ， 用 户 还 可 以 浏览 存储 器 ， 在 Word 和 Excel 
文档 中 敬 入 属性 。 用 户 也 可 以 使 用 录入 模板 把 文档 加 入 到 一 个 对 象 存储 器 ， 并 启 
动 审批 工作 流 。 

3) 组 件 集成 器 : 提供 一 个 不 需要 定制 程序 设计 而 实现 工作 自动 处 理 的 装 
置 ， 使 之 与 工作 流 步 又 中 的 外 部 实体 进行 交互 成 为 可 能 。 组 件 集成 器 处 理 Java 
类 的 导入 ， 并 管理 流程 引 敬 和 接口 之 间 的 通信 。 组 件 集成 器 使 用 SOAPZHTTP 作 
为 传输 协议 ， 为 流程 编排 提供 Web 服务 调用 框架 。 组 件 集成 器 包括 众多 适 配 央 ， 
它们 是 流程 引擎 事件 与 外 部 实体 进行 通信 的 接口 。 

4) 内 容 和 流程 Java API: 用 于 定制 应 用 和 扩展 的 开 箱 即 用 应 用 程序 的 Java 
类 扩展 集合 。 这 些 类 为 内 容 和 流程 引擎 的 交互 提供 了 可 编程 的 接口 。 开 发 人 员 可 
以 使 用 这 些 API 建立 不 同 的 应 用 程序 ， 包 括 这 些 基 于 J2EE Web 容器 或 是 分 立 的 
]2SE 的 Java 应 用 程序 。 

5) Web 应 用 工具 包 : 提供 一 个 可 扩展 的 框架 和 可 重用 的 模块 ， 建 立 Web 应 
用 。 工 具 包 为 让 开发 者 访问 内 容 引 擎 、 流 程 引擎 和 第 三 方 后 端 服务 器 。 为 识别 号 
份 、 事 件 安排 、 状 态 信息 、 参 数 选择 、 本 地 化 和 坚实 的 可 扩展 应 用 程序 的 其 他 功 
能 提供 行为 和 数据 结构 。 工 具 包 是 一 个 可 重用 的 用 户 界 面 组 件 集 ，FileNet 公司 
基于 其 工具 包 ， 开 发 出 了 很 多 Web 应 用 程序 ， 包 括 Workplace 和 记录 管理 。 

6) 应 用 集成 工具 包 : 应 用 集成 工具 包 是 全 功能 的 API， 可 使 第 三 方 把 他 们 
基于 Windows 开发 的 客户 应 用 程序 与 Workplace 进行 集成 。FileNet 使 用 这 个 工具 
包 提 供 对 Excel、Power Point 和 Outlook 的 集成 ，FileNet 电子 表单 设计 软件 也 使 用 
这 个 工具 包 。 客 户 和 合作 伙伴 可 使 用 这 个 工具 包 与 其 他 应 用 程序 进行 集成 ， 基 本 
不 需要 开发 代码 。 

7) 应 用 引擎 UI 服务 : 这 是 一 个 应 用 引擎 服务 ,许多 应 用 程序 用 它 访 问 电 
子 表 单 ， 通 过 录入 模板 采集 内 容 、 检 和 内容、 访问 工作 任务 和 步骤 处 理 句 ,通过 
浏览 多 选择 对 象 ， 应 用 引擎 UI 服务 支持 来 自 胖 客户 端 应 用 程序 和 基于 WEB 的 瘦 
客户 端的 请 求 。 
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8.1.5 FileNet P8 转换 引擎 


转换 引擎 提供 了 对 不 同 格式 文件 进行 转换 的 能 力 ， 可 以 把 Office 转 成 PDF 或 
者 HTML 格式 。 同 时 可 设 定 多 重 转换 引擎 ， 以 支持 大 量 转换 的 请 求 。 

应 用 程序 可 以 通过 FileNet 提交 一 个 发 布 请 求 ， 发 布 请 求 可 以 是 简单 地 在 一 
个 新 的 文件 夹 中 创建 一 个 文档 的 副本 ， 同 时 赋予 新 的 安全 控制 ， 或 者 是 将 文档 内 
容 转换 成 另外 一 种 格式 ， 发 布 请 求 进入 到 内 容 引擎 的 队列 中 ， 后 台 发 布 任务 会 不 
断 地 调用 相应 的 发 布 时 间 处 理 器 进行 队列 中 的 任务 操作 ， 如 果 格 式 转换 是 发 布 请 
求 的 一 部 分 ,那么 事件 处 理 器 会 将 相应 的 文档 发 送 到 转换 引擎 执 行 相应 的 转换 。 








8.2 FileNet P8 的 扩展 能 





FileNet P8 组 件 提 供 多 层级 、 分 布 式 的 架构 能 力 ， 可 支持 企业 级 的 扩展 。 同 
时 提供 垂直 和 水 平 的 扩展 解决 方案 ， 垂 直 扩 展 系 统 可 以 通过 添加 相应 的 CPU 数 
量 提高 系统 的 处 理 能 力 。 水 平 扩展 系统 可 以 通过 增加 服务 右 的 数量 来 增加 整体 系 
统 的 处 理 能 力 。FileNet P8 提供 的 扩展 能 力 技术 细节 如 下 : 

1) 应 用 引擎 支持 海量 用 户 的 水 平 扩展 ， 还 可 以 通过 在 单个 应 用 服务 器 上 运 
行 多 个 实例 的 方式 , 或 者 通过 配置 一 个 实例 来 利用 系统 资源 。 

2) 内 容 引 苟 支 持 水 平 扩展 ， 支 持 大 量 的 内 容 负 葆 请求， 还 可 以 通过 单个 应 
用 服务 器 上 运行 多 个 实例 的 方式 ， 或 者 配置 一 个 实例 来 利用 系统 资源 。 

3) 流程 引擎 支持 水 平 扩 展 ， 支 持 大 量 的 流程 处 理 请 求 ， 还 可 以 通过 在 单个 
的 流程 服务 器 上 运行 多 个 逻辑 分 区 的 防护 器 ， 或 者 配置 一 个 逻辑 分 区 来 利用 
系统 。 

数据 库 软 件 可 以 独立 部 署 ， 远 程 配 置 并 运行 ， 这 样 的 好 处 包括 : 

1) 客户 拥有 对 应 用 程序 和 数据 库 之 间 分 配 资源 的 最 大 支配 权 。 

2) 数据 库 可 以 放置 在 专用 的 、 并 由 数据 库 管 理 员 分 工 管理 的 系统 上 。 

3) 独立 于 数据 库 ， 使 内 容 引 擎 和 应 用 引擎 可 利用 应 用 服务 器 的 能 力 更 好 地 
实现 水 平 扩展 能 

4) 访问 内 容 库 的 服务 可 以 分 布 到 数量 不 限 的 机 器 上 ， 以 处 理 海量 用 户 的 访 
问 请 求 。 

5) 多 重 内 容 库 可 以 分 布 到 各 个 数据 库 和 机 器 ， 使 相同 的 系统 能 为 多 个 应 用 
程序 服务 。 

6) 用 户 可 以 通过 跨 库 ( 即 联 合 ) 搜索 ,访问 发 布 到 不 同 存 储 库 的 内 容 。 

7) 可 以 方便 地 把 网 站 配置 为 多 目标 形式 ， 以 处 理 海量 用 户 。 

总 之 ， 通 过 FileNet P8 的 多 种 扩展 能 力 ， 可 以 支持 高 数据 量 、 高 访问 量 的 企 
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业 应 用 。FileNet P8 平台 对 系统 可 承受 的 最 大 用 户 数 无 特定 限制 ， 通 过 对 集群 的 
部 署 方 式 可 以 无 颖 地 扩展 系统 ， 满 足 对 不 同 数量 用 户 的 访问 需求 。 











8.3 ”内容 管理 对 象 


内 容 管理 平台 的 核心 是 捕获 、 管 理 和 存储 业务 相关 数字 资产 的 内 容 库 服务 。 
全 一 个 系统 中 ， 可 以 创建 和 管理 多 个 内 容 库 ( 称 为 对 象 存储 器 ) 来 服务 业务 要 
求 ， 可 以 配置 对 象 存储 器 ， 让 它 将 内 容 存储 在 数据 库 、 文 件 系统 、 固 定 内 容 设备 
或 者 上 述 内 容 的 组 合 中 。 对 象 存储 器 可 以 存储 各 种 与 业务 相关 的 数据 ， 例 如 ， 保 
维 索 赔 、 客 户 贷款 账户 、 有 关 业 务 合作 伙伴 的 信息 等 。 它 还 可 以 存储 任何 类 型 的 
结构 化 和 非 结构 化 内 容 ， 如 XML 文档 、Office 文档 、Web 页 面 、 相 片 、 声 音 、 
图 片 、 图 像 、 流 程 定义 、 模 板 等 。 


8.3.1 基于 内 容 管理 的 应 用 环境 


FileNet P8 包含 两 种 应 用 环境 来 为 用 户 提供 企业 内 容 管理 功能 : Workplace 
XT 和 Workplace。 

Workplace XT 是 下 一 代 FileNet P8 平台 Web 应 用 ， 以 熟悉 的 浏览 和 搜索 界面 
为 基础 而 构建 的 ， 用 户 能 在 其 内 容 管理 环境 中 快速 提高 生产 力 。 业 务 应 用 设计 者 
可 利用 Workplace XT 提供 的 工具 ， 如 流程 设计 如 和 录入 模板 来 调用 FileNet P8 的 
文档 管理 和 业务 流程 管理 特性 。Workplace XT 自动 提供 以 下 文件 夹 . 

1) 收藏 文件 来， 用 户 能 在 其 中 保存 频繁 访问 的 文件 夹 和 文档 的 链接 。 

2) 所 有 搜索 文件 夹 ， 列 出 了 所 有 预定 义 的 搜索 。 

3) 检 出 列表 文件 夹 ， 列 出 了 用 户 当 前 正在 查看 的 所 有 文档 。 

Workplace 是 上 一 代 FileNet P8 平台 Web 应 用 。 用 户 能 够 自 定义 Workplace 
以 满足 需求 ， 或 使 用 它 作为 创建 定制 应 用 的 模板 。Workplace 提供 内 容 管理 和 流 
程 管理 等 功能 。Workplace 还 支持 P8 的 一 些 扩展 功能 ， 如 记录 管理 、 表 单 管 理 以 
及 门户 。Workplace 是 使 用 Web 应 用 工具 集 创 建 的 Web 应 用 程序 ， 需 要 在 有 
Web 容 央 的 PEE 应 用 服务 器 上 运行 ，Workplace 支持 WAS、WebLogic 及 JBoss 
等 多 种 产品 。Workplace 通过 JSF 、AJAX 等 技术 来 呈现 用 户 界 面 的 元 素 ， 如 查询 
的 结果 、 文 档 的 内 容 等 ， 而 诸如 搜索 设计 项 等 功能 通过 Java Applet 来 呈现 。 
Workplace 可 以 支持 多 种 操作 系统 上 的 多 种 浏览 


8. 3.2 个 性 化 界面 定制 


Workplace 模块 是 集 多 个 功能 模块 的 公共 服务 区 ， 用 户 可 以 根据 自己 的 需要 
选择 不 同 的 功能 ， 创 建 个 性 化 的 My Workplace 门户 视图 。 在 My Workplace 环境 
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中 ， 用 户 可 以 管理 个 人 邮箱 、 浏 览 对 象 存储 器 、 查 看 搜索 结果 、 查 看 运行 的 工作 
流 列表 、 查 看 特定 工作 队列 中 的 工作 项 目 列表 ， 以 及 查看 创作 工具 ，My Work- 
place 门户 视图 允许 同时 查看 多 个 页 面 ， 还 可 以 包括 外 部 Web 站 点 的 portlet， 如 
图 8-1 所 示 。 
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图 8-1 个 性 化 的 My Workplace 门户 视图 
8. 3. 3 文档 管理 


用 户 可 以 通过 Workplace 进行 下 列 的 文件 管理 任务 ,例如 ， 增 加、 检索 、 浏 
级 、 版 本 管理 、 删 除 文档 。 根 据 被 赋予 的 角色 和 权限 ， 用 户 可 以 实现 以 下 
的 文档 管理 功能 

1) 增加 和 删除 文件 ， 进 行文 件 检 索 和 模板 设计 。 

2) 更 新 、 修 改 文 档 和 对 象 的 属性 (元 数据 ) 以 及 安全 属性 。 

3) 浏览 、 检 索 文 件 夹 和 文件 。 

4) 创建 其 他 格式 的 文档 版 本 ， 将 文档 发 布 到 多 个 存储 位 置 ， 进 行文 件 格 式 
转换 ， 例 如 ，Word 文件 转化 成 HTML 或 PDF 文件 。 

5) 模板 化 添加 流程 ， 例 如 ， 创 建 添加 模板 、 检 索 模板 和 发 布 模板 。 


8.3.4 流程 管理 


大 
览 、 


根据 用 户 权 限 ， 用 户 可 以 实现 很 多 的 流程 管理 任务 ， 包 括 : 
1) 浏览 、 执 行 和 重新 分 配 工作 任务 。 
2) 定义 、 管 理 和 配置 工作 流 的 launch 方式 。 
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3) 验证 工作 流 ， 通 过 工作 流 模 拟 程序 ， 提 高 工作 流程 的 效率 。 
8. 3.5 配置 管理 


用 户 能 够 通过 修改 站 点 和 用 户 首选 项 来 配置 Workplace 和 Workplace XT， 以 
满足 应 用 要 求 。 能 够 修改 基于 文本 的 输入 文件 (例如 XML) 来 定制 任 一 应 用 环 
境 。 对 于 Workplace， 用 户 可 以 修改 和 请 求 获得 的 源 代 码 。 下 面 给 出 了 使 用 这 些 
方法 进行 配置 和 定制 的 实例 。 

1. 使 用 站 点 和 用 户 首选 项 进行 配置 

站 点 首选 项 是 应 用 于 所 有 用 户 的 配置 选项 ， 可 以 由 管理 员 设 置 。 用 户 首选 项 
是 应 用 于 单一 用 户 的 配置 选项 。 当 升级 到 新 版 本 或 安装 新 补丁 包 时 ,使 用 站 点 和 
用 户 首选 项 进行 的 配置 可 完全 向 后 兼容 。FileNet P8 文档 包含 对 可 以 进行 设置 的 
众多 首选 项 的 详细 说 明 : 

1) 将 列表 配置 为 显示 详细 视图 或 期 刊 视图 。 详 细 视 图 以 表格 形式 显示 一 列 
由 管理 员 指 定 的 属性 ; 期 刊 视图 显示 由 管理 员 定 义 的 串联 属性 和 附加 文本 构成 的 
短 句 。 

2) 控制 当 用 户 启 动 应 用 时 首先 显示 哪个 页 面 。 例 如 ， 用 户 可 以 从 搜索 、 浏 
览 或 任务 页 面 启动 ， 这 取决 于 站 点 首选 项 的 设置 。 

3) 使 用 用 户 首 选项 将 代 站 点 首选 项 来 控制 当 应 用 启动 时 所 显示 的 页 面 。 

4) 修改 用 户 在 浏览 和 搜索 时 最 早 看 到 的 内 容 : 所 有 对 象 存储 器 ， 或 特定 文 
件 夹 ， 或 由 用 户 定 义 的 快捷 方式 所 指定 的 搜索 。 

5) 将 链接 添加 到 应 用 之 外 的 站 点 或 工具 。 

6) 定义 不 同 访问 角色 的 成 员 调 用 特性 的 方式 。 用 户 能 够 根据 其 访问 角色 来 
调用 特定 特性 和 命令 ， 特 定 访问 角色 的 成 员 还 能 够 明确 地 被 准予 或 拒绝 访问 。 如 
能 够 利用 访问 角色 来 组 织 用 户 查 看 特定 页 面 。 此 外 ， 还 能 够 利用 访问 角色 来 限制 
用 户 对 只 针对 特定 类 型 的 对 象 (例如 文件 夹 或 文档 ) 可 用 的 操作 访问 。 

7) 为 拥有 相似 要 求 的 用 户 组 配置 不 同 的 门户 页 面 。 用 户 还 能 够 创建 个 人 页 
面 。My Workplace 门户 页 面 可 从 一 个 页 面 快 速 访问 数 个 My Workplace 视图 。 

8) 用 户 能 够 使 用 定制 内 容 来 创建 My Workplace 页 面 。 

9) 用 户 能 够 定义 默认 搜索 条 件 。 

2. 通过 修改 配置 文件 进行 定制 

两 种 应 用 都 包含 知 干 基于 文本 的 配置 文件 ,用户 可 以 修改 这 些 文件 来 定制 应 
用 的 外 观 和 行为 。 当 升级 到 新 应 用 引擎 或 Workplace XT 版 本 或 补丁 包 时 ， 定 制 
不 会 自动 更 新 ， 因 此 需要 一 些 计划 来 确保 上 一 个 版 本 中 的 定制 也 能 应 用 到 新 版 本 
中 。 因 为 定制 受到 配置 文件 的 制约 ， 所 以 重新 部 署 任何 变更 都 是 一 种 直接 而 简单 
的 过 程 。 
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1) 通过 修改 操作 描述 符 XML 文件 ， 可 以 配置 用 户 能 够 执行 的 操作 ， 例 如 
“ 检 和 人 和” 或“ 下载” 。 这 些 文件 包含 对 上 下 文 荣 单 、 多 选 菜单 和 信息 页 面 中 显示 
的 操作 定义 。 用 户 还 能 够 定义 操作 在 何 种 条 件 下 显示 。 

2) 注册 可 支持 检索 外 部 文档 的 Java Servlet， 这 些 外 部 文档 的 内 容 位 于 其 他 
存储 库 。 


8.3.6 应 用 开发 


用 户 可 以 请 求 获取 Workplace 源 代码 ， 开 发 人 员 能 够 将 Workplace 用 作 创 建 
和 测试 流程 的 开发 基础 ， 还 可 以 定制 Workplace 来 添加 新 功能 。 

1) 配置 用 户 令 牌 以 允许 单 点 登录 。 单 点 登录 意味 着 FileNet P8 授权 令 牌 可 
以 在 多 个 Workplace 和 自 定 义 应 用 之 间 共 享 ， 因 而 避免 了 多 次 登录 不 同 应 用 的 麻 
烦 。 多 个 基于 Web 应 用 工具 包 的 应 用 能 够 彼此 传递 用 户 令 牌 。 令 牌 可 用 于 众多 
情况 ， 包 括 Workplace 操作 、 信 息 页 面 以 及 应 用 整合 。 

2) 定制 属性 视图 ， 将 其 整合 到 所 提供 的 信息 页 面 或 自 定 义 页 面 中 。 管 理 员 
根据 内 容 类 型 或 类 ID 定义 了 启动 自 定义 属性 视图 的 条 件 。 举 例 而 言 ， 保 存 不 同 
类 型 内 容 的 文档 或 保存 不 同类 ID 的 文件 夹 可 能 具有 不 同 的 属性 视图 ， 而 其 他 视 
图 (例如 安全 性 、 版 本 等 ) 可 能 相同 。 

3) 整合 可 支持 查看 种 类 广泛 的 文档 格式 的 查看 器 ， 人 允许 用 户 标记 文档 。 

4) 在 现 有 Workplace 功能 基础 上 增加 更 多 功能 ， 例 如 ， 可 选择 多 个 文档 和 
排序 文档 的 辅助 操作 。 

5) 显示 其 他 系统 的 数据 例如， 新 增 一 栏 来 显示 与 文档 相关 ,但 是 存储 在 
分 离 应 用 中 的 数据 。 

6) 通过 改变 图 示 符 、 徽 标 和 样式 表 来 修改 观感 。 

7) 移 除 应 用 不 需要 的 功能 ， 移 除 作者 页 面 ， 或 限制 用 户 只 浏览 单个 对 象 存 
储 器 。 


8. 3.7 应 用 集成 功能 


FileNet P8 提供 的 工具 可 帮助 用 户 整合 多 种 来 自 其 他 供应 商 的 应 用 。 

1. 微软 Office 集成 

FileNet P8 可 与 Office 和 Outlook 整合 ， 能 够 直接 在 Office 中 管理 FileNet P8 对 
象 存储 器 内 的 文档 、 电 子 邮 件 和 附件 。Outlook 配置 文件 提供 了 一 个 配置 简单 的 简 
化 系统 来 捕捉 电子 邮件 和 附件 ， 并 将 它们 存储 在 FileNet P8 对 象 存储 器 中 ， 对 Out- 
look 的 支持 也 使 搜索 和 记录 管理 功能 的 性 能 得 到 增强 ， 这 是 通过 自动 捕获 电子 邮件 
传输 数据 而 实现 的 。 借 助 0ffice 支持 ， 用 户 可 以 从 熟悉 的 菜单 中 选择 任务 ， 将 Of- 
fice 文档 添加 到 FileNet P8 对 象 存储 器 中 ， 图 8-2 所 示 为 与 应 用 整合 的 Word。 
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图 8-2 与 微软 Office 集成 


2. SAP 集成 

FileNet SAP R/3 应 用 连接 需 是 一 种 模块 化 的 ECM 解决 方案 ,通过 SAP Ar- 
chiveLink 和 Kpro 界面 与 mySAP 应 用 无 颖 整合 。 它 提供 了 面向 由 SAP 生成 的 商业 
文档 、SAP 数据 库 数 据 和 报告 的 出 站 存档 和 检索 ， 还 提供 了 面向 在 SAP 外 部 生 
成 的 文档 的 入 站 存档 和 检索 。 除 了 满足 典型 SAP R/3 文档 支持 用 例 之 外 ， 指 向 
FileNet P8 对 象 存 储 带 的 文档 链接 还 使 客户 能 够 使 用 FileNetECM 解决 方案 来 改善 
和 扩展 业务 流程 ， 使 之 超越 SAP 应 用 的 限制 。 

3. 门户 集成 

FileNet P8 提供 portlet 来 交付 多 种 领域 的 功能 。portlet 是 能 够 插入 到 门户 
(例如 Oracle WebLogic 和 IBM WebSphere) 中 的 用 户 界面 元 素 ， 为 用 户 提供 了 浏 
览 、 快 速 搜索 、 公 共 收 件 箱 等 功能 。FileNet P8 Web 用 户 界 面 Workplace 也 使 用 
这 些 portlet， 人 允许 用 户 定制 界面 、 查 看 大 量 数 据 。 示 例 portlet 包括 收 件 箱 、 公 共 
工作 项 目 队列 、 内 外 部 Web 站 点 、 文 件 夹 结 构 、 快 速 搜 索 、 活 动工 作 流 、 管 理 
任务 等 。 这 些 portlet 允许 使 用 可 配置 的 观感 ， 快 速 而 直观 地 访问 公共 内 容 和 流程 
管理 功能 。 

4. 与 SharePoint ECM 集成 

FileNet P8 和 微软 的 SharePoint 技术 是 免费 的 解决 方案 ， 当 结合 使 用 时 ， 能 
够 提供 一 种 环境 ， 人 允许 业务 用 户 轻 松 地 协作 处 理 流程 中 的 文档 和 任务 ， 还 遵守 企 
业 的 内 容 和 遵从 性 计划 。SharePoint 用 户 能 够 继续 使 用 SharePoint 易 用 而 熟悉 的 
界面 ， 同 时 FileNet P8 提供 了 对 用 户 透 明 的 健壮 内 容 、 流 程 和 遵从 性 基础 架构 。 
通过 这 种 方法 ， 业 务 用 户 能 够 利用 0ffice SharePoint 服务 站 点 和 SharePoint 门户 来 
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处 理 大 部 分 日 常 内 容 、 流 程 和 遵从 性 活动 ， 而 不 必 学 习 新 应 用 或 执行 其 他 内 容 或 
遵从 性 管理 任务 。 

FileNet P8 吸收 并 扩展 了 SharePoint 产品 和 技术 ， 人 允许 SharePoint 内 容 与 企业 
现 有 的 异 构 计 算 环 境 互 操作 。 此 外 ，FileNet P8 支持 组 织 快 速 部 署 SharePoint 以 
应 对 围绕 协作 的 关键 企业 和 IT 要 求 ， 同 时 提供 强大 的 内 容 、 流 程 和 遵从 性 基础 
架构 以 确保 授权 用 户 可 访问 SharePoint 活动 ， 这 些 活动 绝对 安全 并 且 处 于 完整 的 
生命 周期 和 遵从 性 管理 之 下 。 
越 来 越 多 的 公司 认识 到 知识 工作 者 和 产生 的 知识 库 将 是 巨大 的 竞争 优势 。 利 
用 SharePoint 服务 ， 组 织 能 够 轻松 促进 工作 组 与 项 目 团 队 之 间 的 协作 。 利 用 
FileNet P8 能 够 通过 整合 式 内 容 和 业务 流程 以 及 方法 更 好 地 控制 和 利用 重要 内 容 ， 
在 提高 工作 效率 的 同时 满足 企业 安全 性 、 存 储 和 遵从 性 需求 。 


8.3.8 电子 表单 管理 


FileNet eForms 可 以 帮助 用 户 设 计 、 管 理 和 处 理 用 于 ECM 的 电子 表单 。 它 的 
设计 环境 功能 强大 ， 无 需 编写 代码 或 后 端 脚 本 。eForms 允许 客户 在 Web 浏览 
中 创建 和 管理 在 线 表 单 ， 这 些 表单 外 观 上 与 硬 拷贝 的 纸 质 表单 一 致 ， 但 更 先进 、 
更 易于 使 用 ， 而 且 实现 成 本 更 低 。 使 用 eForms 设计 器 创建 的 在 线 表单 能 够 减少 
数据 输入 时 间 ， 提 高 数据 准确 度 ， 这 是 简化 和 加 快 事务 处 理 的 第 一 步 。 

eForms 能 够 将 电子 表单 作为 独立 文档 进行 处 理 ， 或 在 业务 流程 工作 流 中 将 
电子 表单 用 作用 户 界 面 。eForms 允许 创建 高 保 真 、 高 智能 化 的 电子 表单 ， 而 不 
需 定制 编程 。eForms 提供 以 下 特性 和 获 益 ， 用 户 无 需 修改 就 能 使 用 它们 。 

1. 将 表单 作为 一 种 文档 类 型 来 处 理 

将 表单 用 作 一 种 文档 类 型 ， 可 以 使 用 Workplace 填写 、 存 盘 和 存储 ， 可 以 与 
其 他 FileNet P8 特性 (例如 文档 类 和 录入 模板 ) 紧密 整合 ， 在 保存 表单 时 ， 使 用 
文档 属性 映射 ， 自 动 使 用 表单 的 值 填充 表单 数据 文档 元 数据 ， 可 以 整合 数字 
签名 。 

2. 使 用 表单 来 管理 工作 流 

使 用 表单 来 管理 工作 流 ， 可 以 包括 文档 表单 的 所 有 特性 ， 可 以 与 流程 引擎 
和 工作 流 紧 密 整 合 。 自 动 将 表单 中 的 值 映射 到 工作 流 数据 字段 ， 用 于 流程 决 
策 。 将 工作 流 数据 字段 的 值 映射 到 表单 字段 ， 以 使 用 流程 特定 数据 预 填充 
表单 。 

作为 执行 工作 流 步 又 的 用 户 界面 ， 包 括 数据 检查 和 错误 信息 等 特性 使 用 户 可 
以 轻松 处 理工 作 流 ， 尽 量 减少 数据 录入 错误 。 表 单 上 的 字段 可 以 链接 到 工作 流 数 
据 字 段 ， 无 须 编 写 HTML 代码 和 JavaScript， 每 个 工作 流 步 骤 均 可 控制 页 面 的 


显示 。 
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3. 表单 策略 向 导 

表单 策略 是 一 个 对 象 存储 文档 ， 描 述 了 如 何 使 用 特定 表单 。 有 两 种 类 型 的 表 
单 策略 ， 分 别 为 面向 文档 表单 和 工作 流 表单 。 当 用 户 想 创建 新 表单 时 ， 需 要 单 击 
表单 策略 文档 ， 表 单 策略 向 导 是 Workplace 内 的 点 击 式 界面 ， 允 许 您 创建 表单 策 
略 文档 。 此 界面 使 您 无 须 编 码 就 可 以 指定 多 种 表单 行为 ， 包 括 显示 哪个 表单 模 
板 、 用 于 在 对 象 存 储 器 中 保存 表单 数据 的 录入 模板 、 表 单数 据 映射 为 文档 属性 、 
表单 窗口 界面 的 简单 定制 ， 以 添加 HTML 标题 和 侧 栏 。 

另外 ， 用 户 还 可 针对 工作 流 策 略 而 指定 : 表单 是 否 是 步骤 的 基本 内 容 、 在 步 
又 处 理 器 用 户 界面 中 直接 显示 、 表 单 的 哪些 页 面 将 在 某 一 特定 步 又 显示 、 哪 些 表 
单数 据 字段 会 被 映射 ， 从 而 与 工作 流 数据 字段 交换 信息 。 映 射 表单 数据 允许 工作 
流 根据 填充 到 表单 中 的 数据 的 状态 做 出 决策 : 哪些 表单 数据 字段 会 被 映射 ， 从 而 
与 工作 流 数据 字段 交换 信息 。 映 射 表单 数据 允许 工作 流 根 据 填充 到 表单 中 的 数据 
的 状态 做 出 决策 。 图 8-3 简略 显示 了 一 个 简单 的 工作 流 ， 其 中 每 一 个 步骤 都 附加 
了 一 个 独立 表单 作为 基本 内 容 。 
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8-3 ”基于 独立 表单 的 工作 流 策略 图 
4. 电子 表单 的 设计 
FileNet 电子 表单 的 设计 是 运行 在 客户 桌面 的 强大 的 表单 设计 应 用 。 如 图 8-4 
所 示 ， 用 户 可 以 使 用 它 来 创建 任意 表单 、 添 加 智能 功能 ， 例 如 自动 计算 、 数 据 验 
证 、 表 单 模板 格式 化 工具 ， 以 在 用 户 使 用 表单 时 提供 帮助 ， 有 利于 预防 数据 录入 
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错误 、 配 置 与 外 部 数据 源 的 连通 性 、 实 现 数据 查询 、 减 少 用 户 的 数据 录入 。 

在 eForms 设计 器 中 用 户 可 以 使 用 整合 特性 来 轻松 管理 表单 模板 ， 例 如 方便 
地 检查 表单 模板 的 进出 ， 向 对 象 存储 器 添加 表单 模板 。 整 合 还 为 表单 模板 提供 了 
集中 内 容 管 理 、 版 本 控制 和 安全 性 。 
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图 8-4 FileNet 电子 表单 设计 图 


8.3.9 记录 管理 器 


记录 管理 带 旨 在 解决 当今 面向 流程 的 企业 记录 管理 和 遵从 性 需求 ， 这 种 记录 
管理 解决 方案 可 帮助 公司 通过 高 效 的 、 可 执行 的 记录 管理 策略 来 管理 风险 ， 经 济 
有 效 地 实现 遵从 性 。 

记录 管理 器 是 完全 整合 的 记录 管理 解决 方案 ， 可 以 用 它 来 捕获 、 保 护 和 访问 
业务 记录 和 流程 ， 使 它们 与 相关 内 容 建 立 联 系 ， 根据 自动 执行 的 管理 、 法 律 和 规 
范 原 则 来 经 济 有 效 地 保存 和 管理 记录 。 记 录 管 理 器 帮助 企业 遵守 规定 、 执 行 策 
略 、 避 免 潜 在 的 法 律 程序 处 罚 ， 同 时 简化 、 自 动 化 流程 ， 与 不 同 的 信息 系统 相 
连 ， 访 问 和 管理 所 有 形式 的 内 容 。 
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利用 核心 的 FileNet P8 内 容 和 流程 管理 功能 ， 能 够 使 用 记录 管理 器 服务 和 应 
用 来 实现 下 列 的 功能 : 

1) 使 用 与 Workplace 整合 的 基于 Web 的 应 用 ， 管 理 文件 计划 ， 记 录 处 置 安排 。 

2) 把 文档 从 Workplace 和 Office 添加 到 FileNet P8 对 象 存储 器 时 ， 将 这 些 文 
档 声明 为 记录 。 

3) 使 用 内 容 引擎 事件 操作 、 流 程 组 件 和 定制 应 用 来 自动 化 记录 声明 。 

4) 管理 存储 在 FileNet P8 对 象 存储 器 中 的 文档 。 

5) 管理 存储 在 外 部 ( 即 非 FileNet P8 存储 库 中 ) 并 在 记录 管理 器 系统 中 引 
用 的 物理 记录 。 

6) 利用 可 管理 存储 在 其 他 库 里 的 记录 的 架构 。 

7) 创建 记录 文件 夹 来 包含 相关 记录 。 

8) 搜索 记录 、 持 有 记录 、 生 成 报告 、 审 核 记录 。 

9) 使 用 提供 的 工作 流 来 管理 记录 的 查看 和 人 处置。 

10) 定制 工作 流 ， 以 满足 特定 业务 需求 。 


8. 3.10 电子 邮件 管理 


电子 邮件 管理 可 以 自动 识别 带 有 业务 价值 内 容 的 来 往 邮 件 消 息 ， 并 将 其 汇 和 人 
FileNet 系统 ， 与 其 他 业务 文档 一 样 地 管理 。 邮 件 管 理 软件 可 与 企业 电子 邮件 系 
统 集成 ， 如 Exchange 和 Lotus Domino 邮件 服务 髓 ， 以 及 相应 的 电子 邮件 客户 端 
程序 ， 主 要 包括 以 下 组 件 : 

1) 配置 管理 软件 : 它 是 桌面 应 用 程序 ， 邮 件 管理 软件 的 管理 员 可 以 用 它 来 
建立 和 配置 系统 ， 定 义 捕获 邮件 所 需要 的 参数 表 和 规则 ， 定 义 后 处 理 选项 ， 安 装 
在 配置 管理 器 的 服务 器 上 ， 必 须 同时 安装 . NET 网 络 服务 软件 。 

2) 配置 数据 库 : 用 来 存储 在 配置 管理 软件 中 所 定义 的 配置 信息 数据 库 ， 配 
置 数据 库 不 必 与 邮件 管理 器 位 于 同一 台 服 务 器 上 ， 它 可 以 位 于 邮件 管理 能 够 优先 
访问 的 任何 驱动 器 上 。 

3) 电子 邮件 连接 器 : 监控 网 络 Exchange 或 Domino 服务 需 的 日 志文 件 夹 ， 
使 邮件 管理 需 能 够 根据 所 定义 的 参数 表 评 估 每 封 来 往 的 邮件 。 

4) 文件 导入 : 利用 COM API 来 与 FileNet 存储 器 接口 ， 把 捕获 到 的 邮件 消 
息 放 入 FileNet 存储 库 ， 然 后 利用 Java API 把 内 容 从 FileNet 存储 库 里 提取 出 来 。 
文件 导入 支持 记录 管理 软件 的 FileNet P8 ZeroClick 架构 。 


























8.4 FileNet P8 内 容 管理 组 件 


流程 引擎 REST 服务 使 Web 客户 端 和 流程 引 苟 之 间 能 够 进行 通信 ，Work- 
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place XT 可 以 访问 文档 和 其 他 可 以 合并 到 工作 流 中 的 内 容 。 
8.4.1 FileNet P8 捕获 程序 


捕获 程序 提供 了 把 文档 加 入 到 P8 内 容 引 苟 或 影像 管理 存储 右 的 功能 。 
FileNet 捕获 程序 支持 多 种 捕获 方式 ， 包 括 扫描 、 传 真 和 导 和 文件。 捕获 程序 文 
持 目 动 化 的 文档 采集 流程 。 

如 图 8-5 所 示 ，FileNet 捕获 程序 支持 多 种 扫描 仪 ， 从 低 容 量 的 个 人 扫描 仪 
到 高 容量 的 生产 扫描 仪 、 捕 获 程 序 产生 的 FaxEntry 部 分 提供 了 自动 化 方式 捕获 呼 
入 传真 的 功能 。 而 捕获 文档 导入 功能 ， 则 提供 了 用 户 目录 导入 现存 文档 的 途径 。 
捕获 程序 工具 包 让 用 户 和 合作 伙伴 为 影响 流程 创建 附加 功能 。 附 加 的 功能 可 以 是 
捕获 程序 的 插件 、 分 立 的 应 用 软件 等 。 
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图 8-5 ”FileNet 捕获 流程 














8.4.2 基于 文档 的 构件 


针对 SharePoint 文档 库 的 FileNet 连接 器 提供 了 归档 文档 的 能 力 ， 方 法 是 将 文 
档 从 SharePoint 站 点 文档 库 移动 复制 到 FileNet P8 对 象 存 储 器 中 。 当 一 个 Share- 
Point 文档 移动 到 某 个 对 象 存储 器 中 时 ， 有 关 此 文档 的 重要 信息 (如 它 分 配 的 属 
性 ) 将 映射 为 FileNet P8 平台 提供 的 对 应 属性 。 
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针对 SharePoint 文档 库 的 FileNet 连接 器 由 连接 器 管理 服务 服务 器 、Share- 
Point 服务 器 和 一 台 内 容 引擎 服务 器 组 成 。 这 些 服务 器 通过 Web 服务 进行 通信 。 
可 以 选择 将 配置 管理 咒 、 数 据 存 储 需 与 连接 需 管 理 服 务 服务 器 合并 ， 将 配置 文件 
数据 库 与 SharePoint 服务 器 合并 。 

FileNetSharePoint 连接 器 服务 从 SharePoint 系统 读 取 数据 并 将 这 些 数据 发 送 给 
任务 路 由 服务 。 

任务 路 由 服务 处 理 路 由 规则 的 任务 ， 确 定 在 将 一 个 文件 从 SharePoint 文档 库 
移动 到 FileNet P8 对 象 存储 器 中 时 所 执行 的 任务 。 

FileNet P8 目标 连接 器 包含 访问 内 容 引擎 服务 器 所 需 的 信息 。 它 还 指定 了 要 
传输 SharePoint 文档 的 对 象 存储 器 。 

FileNet 远程 连接 如 Web 服务 ， 可 以 将 在 一 台 单 独 的 机 器 上 运行 的 FileNet 
SharePoint 连接 髓 服务 中 的 请 求 转换 为 本 机 SharePoint API 调用 ， 然 后 再 将 啊 应 转 
换 回 去 。FileNet 远程 连接 器 Web 服务 允许 源 收集 器 在 不 同 于 任务 路 由 服务 的 单 
独 机 器 上 运行 。 

配置 管理 需 是 供给 针对 SharePoint 文档 库 的 FileNet 连接 器 和 FileNet P8 内 容 
引擎 管理 员 使 用 的 桌面 应 用 ， 用 于 设置 和 配置 系统 、 为 SharePoint 捕获 定义 配置 
文件 和 规则 ， 以 及 定义 后 处 理 选项 。 


8.4.3 基于 内 容 联合 服务 


基于 内 容 联合 服务 是 为 企业 中 已 有 的 异 构 内 容 存储 库 ， 比 如 IBM DB2 的 内 
容 管理 句 、EMC 的 Documentum、OpenText Livelink 、FileNet 内 容 服 务 、FileNet 
影像 服务 等 提供 统一 的 联邦 访问 接口 ， 用 户 和 应 用 可 以 使 用 统一 的 接口 访问 底层 
的 存储 平台 ， 不 必 关 心 远 程 存 储 库 的 数据 源 连 接 、 数 据 访问 方式 ， 实 现任 意 存 储 
的 目的 。 

1. 功能 结构 

内 容 联 合 服务 由 三 个 重要 的 组 件 构成 ， 分 别 是 导出 方 (Exporter) 、 导 入 方 
(Importer) 以 及 联邦 数据 库 (Federator Database ) 。 

导出 方 的 主要 功能 包括 : 

1) 执行 管理 员 定义 的 规则 ， 从 远程 内 容 存 储 库 中 查找 符合 查询 条 件 的 
文档 。 

2) 将 符合 查询 条 件 的 文档 的 元 数据 ， 或 者 是 文档 的 一 系列 版 本 的 元 数据 写 
人 到 联邦 数据 库 的 某 个 表 中 。 

3) 通过 使 用 IBM 内 容 集成 器 提供 的 数据 映射 编辑 咒 ， 创 建 从 远程 内 容 存 储 
库 到 FileNet P8 的 属性 映射 。 

4) 根据 用 户 输入 ， 为 每 个 联邦 规则 配置 批 处 理 容 量 ， 批 处 理 容量 的 大 小 决 


























164 . 企业 内 容 管理 理论 与 实践 





定 了 每 个 查询 中 导出 方 所 能 处 理 的 文档 数量 。 

导入 方 的 主要 功能 包括 : 

1) 从 联邦 数据 库 中 检索 批 处 理 以 及 文档 信息 。 

2) 记录 哪些 文档 已 经 被 导入 ， 从 而 判断 哪些 规则 是 初次 导 和 请求， 哪些 规 
则 属于 重复 导入 请 求 。 

3) 在 FileNet P8 中 创建 集成 后 的 目标 文档 ， 同 时 创建 从 远程 内 容 存 储 库 中 
的 源 文档 到 目标 文档 的 URL 链接 以 及 文档 版 本 信息 。 

4) 维护 一 个 从 源 文档 的 版 本 序列 到 联邦 存储 库 中 P8 版 本 序列 的 映射 。 

联邦 数据 库 中 存储 的 信息 : 

1) 从 远程 内 容 存储 库 中 查找 出 来 的 文档 的 元 数据 。 

2) 各 个 规则 的 运行 状态 以 及 时 间 戳 信息 。 

3) 配置 信息 ， 其 中 包括 日 志 设 置 以 及 内 容 集 成 服务 器 的 认证 信息 。 

4) 规则 的 相关 信息 ， 其 中 包括 构建 的 查询 条 件 ，FileNet P8 上 目标 文件 夹 
的 名 称 以 及 声明 一 个 记录 的 选项 信息 。 
通过 使 用 内 容 联合 服务 ， 用 户 可 以 将 多 个 应 用 程序 、 不 同 数据 源 、 多 台 服 务 
器 上 的 数据 集成 到 FileNet 内 容 引擎 中 ， 通 常 将 这 个 过 程 称 为 联邦 ( Federation ) 。 
联邦 的 过 程 需要 执行 两 个 非常 重要 的 操作 : 中 创建 从 远程 内 容 存储 库 中 的 源 文档 
到 内 容 引 擎 中 目标 文档 的 引用 ; @ 创 建 从 源 文档 的 元 数据 到 内 容 引擎 中 目标 文档 
属性 的 映射 。 当 用 户 对 集成 后 的 数据 进行 访问 时 ， 感 觉 数据 就 像 是 被 存储 在 内 容 
引擎 中 一 样 。 

2. 业务 流程 

内 容 联 合 服务 的 工作 流程 描述 如 下 : 用 户 登 录 联 邦 管理 应 用 程序 ， 配 置 要 访 
问 的 远程 存储 库 ， 然 后 创建 并 执行 联邦 规则 ; 导出 方 检索 到 新 创建 的 规则 以 后 ， 
首先 判断 哪些 文档 需要 检索 以 及 何 时 执行 查询 ， 然 后 将 查询 条 件 送 往 内 容 集成 
器 ; 内 容 集 成 器 将 查询 条 件 转换 成 远程 存储 库 可 以 理解 的 自然 语言 ， 然 后 送 往 远 
程 存储 库 ; 远程 存储 库 将 符合 查询 条 件 的 文档 ID ， 以 及 文档 元 数据 返回 给 内 容 
集成 器 ， 内 容 集成 器 再 将 这 些 文档 返回 给 导出 方 ; 导出 方 获得 查询 结果 后 ， 将 文 
档 的 引用 以 及 元 数据 写 人 联邦 数据 库 ; 联邦 数据 库 检 索 到 有 数据 更 新 后 ， 将 这 些 
文档 的 引用 以 及 元 数据 送 往 导 入 方 ; 导入 方 创 建 一 个 需要 被 集成 文档 的 列表 ， 然 
后 依次 将 这 些 文档 的 引用 以 及 元 数据 添加 到 内 容 引 擎 的 对 象 存储 库 中 。 


8.4.4 应 用 整合 


应 用 整合 整合 了 0ffice 和 Outlook 以 及 Workplace XT 或 Workplace 的 早期 版 
本 。 应 用 整合 通过 应 用 整合 组 件 与 安装 了 Workplace XT 或 Workplace 的 PEE 应 
用 服务 器 上 的 Java servlet 进行 通信 。 应 用 引擎 用 户 界面 服务 提供 用 户 界 面 ， 通 过 
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一 个 ActiveX 浏览 需 控 件 在 客户 端 显 示 这 个 界面 。 通 过 基于 Windows 的 客户 端 上 
的 应 用 引 警 用户 界面 服务 ， 重 用 Workplace XT 或 Workplace 用 户 界面 ， 提 供 了 
Office 整合 与 Workplace XT 或 Workplace 之 间 丰 富 的 奇偶 校 验 功能 。 

1. 应 用 整合 BCS 

应 用 整合 BCS 整合 了 微软 Office 2007 和 微软 Outlook 2007 以 及 Workplace 
XT。 应 用 整合 使 用 内 容 引 擎 . NET API 与 FileNet P8 进行 通信 ， 内 容 引擎 . NET 
API 位 于 内 容 引擎 Web 服务 的 上 层 。 应 用 整合 BCS 利用 微软 Office 2007 VSTO 技 
术 与 Office 功能 区 整合 ， 并 创建 自 定义 任务 窗 格 。 自 定义 任务 窗 格 使 用 . NET 用 
户 控 件 公开 FileNet P8 属性 、 导 航 和 搜索 功能 。 这 些 控 件 存储 在 一 个 公共 . NET 
库 中 和 被 Word 、Excel 、PowerPoint 和 Outlook 共享 。 

2. SAP R/3 的 应 用 连接 器 

针对 SAP R/3 的 应 用 连接 器 (ACSAP R/3) 的 架构 主要 是 根据 SAP Ar- 
chiveLink 接口 的 需求 制定 的 。 

SAP ArchiveLink 接口 需要 一 个 服务 器 组 件 来 实现 与 归档 有 关 的 请 求 ， 如 归 
档 /检索 文档 或 数据 对 象 、 在 打印 列表 中 搜索 样式 ， 以 及 处 理 后 台 任 务 (如 条 形 
码 自动 化 处 理 ) 。 实 现 这 个 组 件 ， 使 之 作为 SAP R/3 服务 器 进程 和 FileNet P8 对 
象 存储 之 间接 口 ， 即 ACSAP R/3 Gateway。 它 旨 在 通过 FileNet P8 架构 提供 最 大 
的 移植 性 。 这 个 服务 器 组 件 由 4 个 核心 子 系统 组 成 ， 分 别处 理 配置 信息 、 对 象 存 
储 连 接 、 协 议和 条 形 码 。 

配置 子 系统 维护 网 关 的 配置 信息 ， 并 提供 一 个 机 制 ， 当 在 分 布 式 环境 中 部 署 
时 与 其 他 网 关 共 享 这 些 信息 。 条 形 码 子 系统 使 用 SAP 的 Java 资源 适配器 (JRA) 
通过 远程 调用 RFC 函数 来 与 SAP R/3 进行 交互 。 协 议 处 理子 系统 利用 底层 J2EE 
Web 应 用 服务 器 的 HTTP 功能 ， 处 理 HTTP 与 SAP R/3 系统 的 通信 。 内 容 存 储 库 
子 系统 负责 使 用 FileNet P8 API， 在 FileNet P8 对 象 存储 器 之 间 传 输 内 容 。 

ArchiveLink 还 要 求 客户 端 组 件 能 选择 、 查 看 和 链接 存储 在 FileNet P8 对 象 存 
储 器 中 的 文档 。 出 于 链接 目的 ，FileNet P8 客户 端 通过 OLE (对 象 连接 与 庶 入 ) 
自动 与 SAP GUI 进行 通信 。 此 客户 端 还 包括 FileNet P8 的 零 资 源 占用 Java Vie- 
wer， 用 于 显示 ACSAP R/3 Gateway 提供 的 文档 。 

一 个 与 ACSAP R/3 和 FileNet P8 对 象 存储 器 有 关 的 典型 SAP R/3 配置 包括 
以 下 内 容 : 

1) 一 个 或 多 个 R/3 系统 以 及 相关 的 应 用 服务 器 和 数据 库 。 

2) 一 个 或 多 个 FileNet P8 对 象 存 储 器 ， 再 加 上 光盘 或 磁盘 存储 库 ， 可 能 还 
需要 图 像 应 用 服务 器 来 处 理 分 布 式 扫描 操作 。 

3) 一 个 或 多 个 ACSAP R/3 Gateway， 根 据 分 布 式 处 理 和 /或 伸缩 性 确定 网 关 
的 数量 。 
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4) 针对 大 规模 邮件 室 的 Capture 工作 站 ， 用 于 扫描 、QA 和 索引 。 

5) 针对 R/3 工作 站 的 大 量 IDM 桌面 ， 用 于 链接 已 经 提交 给 FileNet 后 端的 
文档 。 

6) 大 量 瘦 客户 端 工作 站 ， 用 于 查看 Web 启用 文档 。 

3. 性 能 监视 功能 组 件 

(1) 指示 板 

FileNet 指示 板 是 一 个 收集 和 分 发 FileNet P8 产品 性 能 数据 的 机 制 ， 这 些 产 品 
安装 在 某 个 站 点 上 ， 独 立 于 操作 系统 。 指 示 板 由 两 大 组 件 组 成 : 一 是 监听 程序 ， 
二 是 管理 器 。 

1) 监听 程序 。 

从 应 用 接收 事件 流 和 其 他 性 能 信息 ， 并 将 这 些 数据 发 送 给 管理 右 进 行 分 析 和 
存储 。 监 听 程 序 相当 于 一 个 SNMP“ 代 理 ”， 使 客户 端 隔 一 段 时 间 就 能 随意 积累 
和 聚合 性 能 数据 。 监 听 程序 被 动 地 等 待 管理 央 来 连接 它 ， 并 查询 它 的 性 能 计数 器 
值 。 如 果 没 有 管理 器 连接 ， 那么 监听 程序 组 件 对 外 部 观察 者 几乎 是 不 可 见 的 。 指 
示 板 提供 了 监听 程序 的 Java 和 Visual C ++ 实现 。 

通过 监听 程序 公开 的 数据 分 为 三 类 : 环境 数据 、 静 态 数 据 和 动态 数据 。 环 境 
数据 是 关于 应 用 操作 环境 的 信息 ， 如 操作 系统 名 称 和 版 本 号 、CPU 的 编号 和 类 
型 、 可 用 内 存 的 数量 等 。 静 态 数据 特定 于 可 实现 指示 板 功 能 的 应 用 ， 而 且 不 会 在 
应 用 运行 时 更 改 。 静 态 数据 的 实例 有 应 用 的 名 称 和 版 本 号 。 静 态 数据 或 Java 应 
用 还 包括 关于 Java 运行 时 环境 的 信息 ， 如 Java 运行 时 的 版 本 号 、 最 大 内 存 等 。 
动态 数据 包括 操作 系统 提供 的 数据 ， 如 CPU 负载 、 使 用 的 内 存 、 网 络 流量 等 ， 
以 及 应 用 特定 数据 ( 计数器、 持续 时 间 和 其 他 由 应 用 提供 给 管理 器 的 信息 ) 。 
此 ， 动 态 数据 的 数量 和 类 型 取决 于 应 用 中 实现 的 规范 级 别 ， 它 可 以 随 着 产品 版 本 
的 不 同 而 不 同 。 

2) 管理 需 。 

连接 到 监听 程序 并 从 中 检索 报告 ， 然 后 处 理 收集 到 的 数据 ， 如 存储 数据 、 以 
图 形 方 式 显 示 数 据 ， 或 者 利用 数据 执行 其 他 应 用 特定 任务 。 指 示 板 提供 了 两 个 管 
理 锅 : 指示 板 和 存档 管理 器 。 指 示 板 用 来 监视 人 性能， 存档 管 理 咒 将 从 某 个 集群 中 
的 监听 程序 收集 到 的 历史 和 实时 数据 保存 到 文件 中 ， 用 户 随后 可 以 在 指示 板 中 加 
载 这 些 文件 来 进行 分 析 、 报 告 等 。 

TCP 套 接 字 连接 指示 板 和 监听 程序 。 每 个 监听 程序 维护 其 应 用 事件 的 一 份 历 
史记 录 ， 管 理 器 可 以 随时 请 求 这 份 历史 记录 。 指 示 板 在 连接 到 每 个 监听 程序 后 ， 
立即 自动 请 求 这 份 历 史记 录 。 监 听 程 序 的 历史 记录 可 以 保存 起 来 供 以 后 使 用 指示 
板 ， 或 独立 的 存档 管理 需 进 行 分 析 。 

(2) 系统 监视 器 
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FileNet 系统 监控 器 收集 和 分 发 FileNet P8 产品 性 能 数据 ， 这 些 产品 安装 在 某 
个 站 点 上 ， 独 立 于 操作 系统 。 系 统 监控 器 由 下 面 的 组 件 组 成 : 

1) 管理 服务 器 ， 接 收 、 处 理 和 存储 来 自 管理 代理 的 事件 。 事 件 可 以 提供 给 
Web 控制 台 进 行 标准 报告 ， 或 者 转发 给 其 他 系统 。 事 件 使 用 电子 邮件 或 SNMP 
MIB 从 可 以 导入 它们 的 系统 转发 到 企业 系统 管理 工具 。 事 件 还 可 以 被 写 人 系统 监 
控 器 日 志文 件 进行 分 析 。 

2) 管理 代理 ， 监 视 运行 状况 参数 (监视 器 和 侦 听 器 ) 和 日 志文 件 。 管 理 代 
理 在 每 台 托管 组 件 上 运行 ， 而 且 可 以 执行 诸如 重新 启动 出 现 故 障 的 组 件 之 类 的 
任务 。 

3) Web 控制 台 ， 一 个 基于 浏览 器 的 图 形 用 户 界面 ， 用 于 访问 事件 控制 台 和 
系统 监控 器 工具 ， 如 任务 执行 管理 器 或 报告 或 知识 库 。 

4) 监控 管理 器 ， 用 于 在 托管 组 件 上 添加 、 删 除 和 配置 监视 器 的 图 形 用 户 界 
面 。 可 以 配置 监视 器 的 执行 时 间 、 浆 值 和 相关 限制 ， 以 及 在 到 达 某 一 国 值 时 自动 
执行 的 活动 。 

5) 任务 执行 管理 器 ， 在 托管 组 件 上 执行 任务 的 图 形 用 户 界 面 。 系 统 监控 器 
提供 了 配置 系统 方面 的 任务 ， 以 及 自动 化 例 程 工作 方面 的 任务 ， 如 重新 启动 某 个 
组 件 或 关闭 整个 FileNet P8 域 。 因 为 有 任务 执行 管理 器 来 执行 任务 ， 所 以 管理 员 
无 需 知道 处 理 任 务 的 详细 信息 。 

(3) 使 用 情况 报告 

FileNet 使 用 情况 报告 生成 程序 包含 以 下 三 个 组 件 : 

1) 监听 程序 。 每 个 受 支持 的 FileNet P8 组 件 向 监听 程序 实时 报告 使 用 事件 。 
监听 程序 总 结 一 天 的 数据 、 在 内 存 中 存储 7 天 的 数据 。 

2) 使 用 情况 收集 器 。 使 用 情况 收集 器 基于 一 个 自动 化 计划 安排 运行 ， 通 常 
是 一 天 一 次 。 它 使 用 TCP 连接 到 每 个 监听 程序 并 下 载 所 有 的 新 使 用 情况 数据 。 
使 用 情况 收集 器 将 这 些 数据 永久 存储 在 本 地 数据 库 中 。 

3) 使 用 情况 报告 生成 程序 。 管 理 员 可 以 在 任意 时 刻 运行 使 用 情况 报告 生成 
程序 来 生成 报告 。 使 用 情况 报告 生成 程序 连接 到 本 地 数据 库 并 显示 信息 。 这 些 信 
息 可 以 以 各 种 格式 (CSV、HTML 或 XML) 导出 ， 通 过 其 他 工具 (如 Excel) 进 
行 其 他 报告 分 析 。 

8. 4. 5 FileNet 影像 服务 

用 户 可 以 使 用 FileNet 服务 存储 影像 ， 并 且 其 他 的 FileNet P8 应 用 也 可 以 使 用 

保存 影像 服务 中 的 有 影像， 根据 需要 可 以 在 影像 服务 中 建立 影像 的 索引 ， 也 可 以 在 


内 容 引擎 中 建立 影像 的 索引 或 者 在 两 者 中 都 建立 索引 。 存 储 在 影像 服务 中 的 影像 
不 仅 可 以 被 影像 服务 使 用 ， 同 时 可 以 被 所 有 的 应 用 使 用 。 



































第 9 童 微软 的 SharePoint 


9.1 _ SharePoint 概述 





SharePoint 是 微软 公司 提供 的 用 于 Windows Server 2003 的 免费 增值 软件 ， 它 
提供 了 基本 的 门户 网 站 和 企业 内 网 功能 ， 包 括 由 ASP. NET 开发 组 成 的 叫做 Web 
部 件 页 面 的 门户 页 面 、 团 队 站 点 、 文 档 库 以 及 项 目 子 站 点 ， 带 有 版 本 控制 的 文档 
存储 空间 以 及 基本 的 搜索 功能 。Windows SharePoint Services 同时 也 是 微软 Office 
SharePoint Portal Server ( MOSS) 和 微软 Office Project Server 的 基础 。 

SharePoint Server (SPS) 2010 用 来 取代 MOSS 2007 ， 它 有 标准 版 和 企业 版 两 
个 版 本 ， 早 期 版 本 中 的 STS 或 WSS 在 2010 中 更 名 为 SharePoint Foundation， 
SharePoint Server 2010 产品 包含 了 SharePoint Foundation 2010 和 SharePoint Server 
2010 两 个 产品 。 








9. 1.1 SharePoint 架构 模型 


微软 SharePoint 2010 提供 企业 级 功能 以 满足 关键 业务 需求 ， 如 管理 内 容 和 业 
务 流 程 。 如 图 9-1 所 示 ， 主 要 由 构架 于 操作 系统 之 上 的 SharePoint Foundation 
2010 、SharePoint Server 2010 以 及 SQL Server 数据 库 构 成 。SharePoint Foundation 
2010 构建 于 IIS 和 ASP. NET 框架 之 上 。SharePoint Server 2010 依赖 于 SharePoint 
Foundation 2010 并 且 提 供用 于 列表 和 库 、 网 站 管理 以 及 网 站 自 定义 的 一 致 框架 。 
SharePoint Foundation 2010 中 可 用 的 任何 功能 在 SharePoint Server 2010 中 同样 
可 用 。 

SharePoint Foundation 基于 ASP. NET 构建 的 ， 此 它 应 用 了 该 环境 中 很 多 大 
家 熟悉 的 概念 ， 包 括 Web 部 件 、 母 版 页 、 导 航 控件 和 移动 适 配 需 。 


9.1.2 服务 器 体系 结构 


微软 SharePoint Foundation 是 一 类 基于 IIS 和 ASP. NET Framework 构建 的 应 
用 程序 。SharePoint Foundation 提供 了 一 个 高 度 结构 化 的 服务 器 对 象 模 型 ， 借 助 
该 模型 ， 即 可 轻松 访问 表示 SharePoint 网 站 各 个 方面 的 对 象 。 用 户 可 以 从 级 别 较 
高 的 对 象 开 始 ， 逐 步 深 入 对 象 层 次 结构 ， 以 获取 包含 要 在 代码 中 使 用 的 成 员 的 
对 象 。 
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图 9-1 SharePoint 的 体系 结构 


图 9-2 所 示 为 与 Microsoft. SharePoint. Administration 命名 空间 的 集合 和 对 象 相 
关 的 SharePoint Foundation 服务 器 体系 结构 。 
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图 9-2 ”SharePoint Foundation 服务 器 体系 结构 
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SPFarm 对 象 在 SharePoint Foundation 对 象 模型 层次 中 处 于 最 高 等 级 。Servers 
属性 获取 表示 部 署 中 所 有 服务 需 的 集合 。Services 属性 获取 表示 所 有 服务 的 集合 。 

每 个 SPServer 对 象 都 表示 一 台 物 理 服务 器 计算 机 。ServicelInstances 属性 提供 
对 单 台 计算 机 上 运行 的 单个 服务 实例 集 的 访问 权限 。 

每 个 SPService 对 象 都 表示 一 个 安装 在 服务 器 场 中 的 逻辑 服务 。SPService 类 
的 派生 类 型 包括 用 于 Windows 服务 (如 定时 服务 、 搜 索 、 数 据 库 服务 等 ) 的 对 
象 ， 以 及 用 于 Web 服务 (如 支持 Web 应 用 程序 的 基本 内 容 发 布 Web 服务 ) 
的 对 象 。 

SPWebService 对 象 提供 对 特定 逻辑 服务 或 应 用 程序 的 配置 设置 的 访问 权限 。 
WebApplications 属性 获取 运行 服务 的 Web 应 用 程序 集合 。 

如 果 此 服务 可 实现 SharePoint Foundation 的 服务 应 用 程序 框架 ， 则 可 将 其 拆 
分 为 多 个 配置 的 服务 器 场 范围 内 的 实例 〈CFSD 。 其 中 每 个 实例 都 可 提供 此 服务 

的 功能 ， 但 各 自 有 各 自 的 单独 权限 和 设置 。 在 特定 服务 器 上 运行 的 每 个 服务 实例 

或 Cel 由 SPServiceInstance 对 象 表示 。 

SPDatabaseServiceInstance 对 象 表示 在 数据 库 服务 器 计算 机 上 运行 的 数据 库 服 
务 的 单个 实例 。SPDatabaseServiceInstance 类 派生 自 SPServiceInstance 类 ， 因 此 继 
承 了 Service 属性 ， 该 属性 提供 对 实例 所 实现 的 服务 或 应 用 程序 的 访问 权限 。Da- 
tabases 属性 获取 服务 中 所 用 的 内 容 数据 库 集合 

每 个 SPWebApplication 对 象 都 表示 一 个 承载 在 HS 网 站 中 的 Web 应 用 程序 ， 
对 象 提供 对 凭据 和 其 他 服务 右 场 范围 应 用 程序 设置 的 访问 权限 。Sites 属性 获取 
Web 应 用 程序 中 的 网 站 集 的 集合 ，ContentDatabases 属性 获取 Web 应 用 程序 中 所 
用 的 内 容 数 据 库 集合 。 

SPContentDatabase 对 象 从 SPDatabase 类 继承 ， 表 示 包 含 Web 应 用 程序 . 用 
户 数据 的 数据 库 。Sites 属性 获取 内 容 数 据 库 存储 其 数据 的 网 站 集 的 集合 ; 
bApplication 属性 获取 父 Web 应 用 程序 ; SPSiteCollection 对 象 表示 Web 应 用 
中 的 网 站 集 的 集合 。 


9.1.3 SharePoint 的 技术 特点 


1) SharePoint Foundation 是 在 HS 上 运行 的 基于 Web 的 应 用 程序 ， 可 以 在 
MS Windows 2008 Server 或 Windows 2008 R2 的 64 位 任何 版 本 上 免费 使 用 。 在 运 
行 时 需要 64 位 的 Windows Server 操作 系统 。 

2) 所 有 的 信息 和 资料 储存 在 一 个 或 多 个 MS SQL Server 数据 库 中 ， 以 网 页 
形式 显示 信息 ， 通 常 包含 一 个 或 多 个 Web Parts。 

3) 有 很 好 的 文档 管理 功能 ， 比 如 文档 版 本 管理 、 自 定义 元 数据 、 整 合 0 
fice 文档 等 。 
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4) 内 置 了 很 多 不 同 的 列表 类 型 ， 以 供 存储 和 使 用 不 同类 型 的 信息 ， 比 如 文 
档 、 联 络 短 、 行 事 历 等 。 

5) 内 置 了 WorkFlow 方案 ， 比 如 当 内 容 有 改动 时 自动 通知 相关 人 员 等 。 

6) 利用 它 的 Web 内 容 管理 功能 ， 可 以 很 好 地 建立 一 个 有 效 的 企业 内 容 基础 
的 互联 网 络 应 用 ， 可 以 很 好 的 管理 数据 、 会 议 、 事 件 、Blog 等 内 容 。 

简单 来 讲 ，SharePoint Foundation 是 一 个 非常 好 的 收集 和 共享 企业 内 部 数据 
的 平台 ， 在 使 用 它 强 大 的 文档 管理 功能 之 前 ， 需 要 把 文档 上 载 到 SPS 文件 库 ， 可 
以 从 Windows 目录 直接 复制 粘贴 进去 。 它 是 一 个 很 好 的 企业 内 部 网 络 应 用 解决 方 
案 ， 并 且 在 Windows 2008 Server 上 可 以 免费 使 用 。 

SharePoint Foundation 技术 上 的 不 足 主要 表现 在 以 下 几 个 方面 ; 

1) 未 提供 进 阶 的 搜索 功能 ，SharePoint Foundation 提供 了 有 限 的 搜索 功能 ， 
但 是 仅仅 允许 用 户 搜索 当前 站 点 内 的 数据 。 

2) 没有 进 阶 的 Web 内 容 管理 功能 ， 比 如 发 布控 制 、 不 支持 多 国语 言 等 。 

3) 没有 进 阶 的 文档 管理 功能 ， 比 如 全 局 的 文档 编码 标识 、 文 档 的 调整 、 文 
档 的 进 阶 使 用 政策 等 。 

4) 没有 指定 的 或 者 其 他 重要 文件 的 管理 记录 。 

5) 不 支持 在 浏览 器 中 使 用 InfoPath 表单 ， 不 支持 在 Web Part 中 使 用 MS Ex- 
cel 电子 表格 ， 不 支持 在 Web Part 中 使 用 MS Visio 2010 图 表 。 

6) 不 支持 关键 性 能 指示 器 (KPI) 。 

为 了 克服 这 些 不 足 ， 方 便 开 发 人 员 使 用 ，SharePoint 提供 了 SharePoint Server 
2010 产品 。 

















9.1.4 SharePoint Server 2010 





SharePoint Server 2010 使 用 SharePoint Foundation 的 基础 架构 ， 但 提供 了 更 多 
的 功能 。 上 面 所 列 出 的 SharePoint Foundation 不 能 支持 的 功能 列表 当中 ， Share- 
Point Server2010 都 能 提供 。 

1) 使 用 全 局 的 搜索 功能 寻找 不 同 的 信息 ， 无 论 信息 的 类 型 和 存储 位 置 怎 
样 ， 是 基于 内 容 还 是 元 数据 ; 使 用 社交 搜索 寻找 人 员 ; 在 不 同 的 人 员 或 群 组 之 间 
分 类 显示 信息 。 

2) 支持 从 AD 导 和 用户 属性 。 

3) 提供 更 高 阶 的 内 容 管理 特性 来 发 布 互 联网 站 点 或 企业 内 部 和 人口 站 点 。 

4) 提供 全 球 唯 一 的 文档 标识 及 设置 。 

5) 用 Form Service 可 以 在 浏览 器 中 显示 InfoPath 表单 ， 利 用 Excel Service 可 
以 在 Web Part 使 用 Excel 电子 表格 及 图 表 ; 利用 VisioWeb Part 可 以 直接 在 浏览 
中 使 用 MS Visio 2010 图 表 ; 利用 Business Connectivity Service 可 以 搜索 、 显 示 以 
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及 编辑 外 部 数据 库 中 的 数据 ， 比 如 SAP、Oracle 以 及 SQL Server 等 。 

6) 给 每 一 位 用 户 提供 了 一 个 可 以 私有 也 可 以 共享 的 个 人 站 点 。 

7) 内 置 了 KPI 仪表 板 。 

所 有 的 这 些 特性 使 SharePoint Server 2010 成 为 一 个 很 好 的 解决 方案 来 建立 不 
同类 型 网 站 、 包 含 公众 信息 的 互联 网 站 点 、 外 部 或 者 企业 内 部 互联 网 络 应 用 ， 并 
且 足 够 灵活 地 为 不 同 的 人 提供 不 同 的 信息 。 并 且 它 也 是 一 个 很 好 的 用 来 显示 或 分 
析 KPI 数据 和 商业 数据 的 解决 方案 ， 比 如 MS Excel 电子 表格 等 ， 良 好 的 商业 智 
能 来 收集 、 显 示 、 分 析 以 及 挖掘 商业 数据 。 









































9.2 SharePoint 企业 内 容 管 理 





SharePoint 企业 内 容 管 理 部 分 的 内 容 在 SharePoint Server 2010 中 提供 。 可 处 
理 企业 中 的 文档 或 其 他 内 容 类 型 的 管理 、 存 储 、 保 留 、 工 作 流 和 交付 。 在 Share- 
Point Server 2010 中 ， 提 供 了 一 个 扩展 选项 子 集 和 一 个 扩展 范围 ， 而 且 其 扩展 性 
比 早期 版 本 中 的 扩展 性 更 大 。 企 业 中 的 所 有 人 员 都 可 使 用 此 功能 ， 这 些 功能 易于 
使 用 并 支持 各 种 内 容 ， 还 具有 较 高 的 可 扩展 性 和 可 缩放 性 。 

它 使 得 用 户 能 够 在 整个 企业 范围 内 创建 、 存 储 、 管 理 、 发 现 文档 和 其 他 内 容 
类 型 以 及 向 它们 应 用 元 数据 。 该 产品 支持 的 主要 功能 如 下 : 

1) 支持 向 网 站 和 页 面 中 添加 视频 、 音 频 和 图 像 并 进行 管理 的 富 媒体 管理 
功能 。 

2) 全 新 的 文档 管理 功能 ， 如 内 容 管 理 器 、 文 档 ID 和 DocIDService 以 及 能 够 
更 轻松 地 传送 、 标 识 和 管理 文档 的 文档 集 。 

3) 用 于 创建 、 应 用 和 存储 自 定义 条 件 以 及 建立 分 类 的 托管 元 数据 服务 。 

4) 增强 的 记录 管理 功能 ， 包 括 就 地 记录 管理 以 及 在 网 站 级 使 用 eDiscovery 
功能 。 

5) 全 新 的 Web 内 容 管理 功能 ， 如 增强 的 内 容 查 询 Web 部 件 。 

SharePoint Server 2010 中 的 企业 内 容 管理 包括 管理 文档 、 管 理 数字 资产 、 管 
理 元 数据 、 管 理 记 录 和 电子 数据 展示 、Web 内 容 管理 等 五 部 分 内 容 。 





























9.3 ”SharePoint 的 文档 管理 


文档 管理 包括 用 于 创建 、 存 储 和 跟踪 文档 、 文 档 集 和 其 他 类 型 的 内 容 的 功 
能 。 功 能 区 包含 内 容 管理 器 、 文 档 中 心 的 模板 和 支持 文档 集 创 建 所 需 的 基础 结 
构 。 它 还 包括 可 用 于 浏览 文档 集 并 基于 元 数据 进行 筛选 的 技术 ， 以 及 用 于 基于 元 
数据 默认 值 查找 文档 的 方法 。 
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SharePoint Server 2010 中 的 文档 管理 内 容 是 在 之 前 版 本 的 基础 上 ， 通 过 扩展 
现 有 功能 和 提供 新 功能 而 构建 的 ， 旨 在 使 企业 能 够 管理 文档 并 使 用 户 能 够 与 单个 
文档 和 文档 组 进行 交互 ， 支 持 信 息 访 问 和 内 容 创建 等 常见 考虑 因素 ， 也 支持 合 规 
性 、 协 作 、 文 档 库 的 大 小 调整 以 及 品牌 推广 等 更 复杂 的 因素 。 
9.3.1 用 户 角色 类 型 


SharePoint 的 文档 管理 功能 是 围绕 三 个 用 户 角 色 设 计 的 ， 文 档 管理 功能 假定 有 




















这 三 类 用 户 与 文档 进行 交互 。 这 三 类 角色 分 别 是 访问 者 、 参 与 者 和 内 容 管理 员 。 
1. 访问 者 
导航 到 文档 中 心 并 通过 查看 、 排 序 、 搜 索 或 者 读 取 文档 来 与 文档 进行 交互 的 
人 员 。 
2. 参与 者 


负责 执行 以 下 一 个 或 多 个 操作 的 人 员 : 导航 到 主页 ， 并 查看 参与 者 上 次 修 
改 、 创 建 或 者 签 出 的 相关 文档 列表 或 文档 集 ， 或 者 查看 分 配给 参与 者 的 工作 任务 
的 列表 ， 在 需要 时 执行 这 些 任务 ; 导航 到 主页 并 向 文档 中 心 提 交 新 的 文档 或 者 文 
档 集 ， 导 航 到 文档 库 ， 选 择 一 个 位 置 ， 并 创建 或 上 载 一 个 新 的 文档 或 文档 集 。 

3. 内 容 管理 员 

拥有 或 维护 文档 库 并 负责 配置 、 自 定义 和 创建 网 站 功能 的 人 员 ， 这 些 人 员 可 
能 会 执行 以 下 操作 : 创建 视图 ， 包 括 主页 上 特定 于 域 的 文档 视图 ;配置 内 容 类 型 
和 关联 模板 ;配置 元 数据 导航 和 筛选 ， 自 定义 默认 工作 流 ， 并 将 其 与 选 定 元 素 关 
联 ; 为 托管 性 更 高 的 大 型 存储 配置 传送 规则 。 


9. 3.2 文档 管理 目标 


SharePoint Server 2010 中 的 文档 管理 主要 支持 以 下 三 个 目标 : 

1) 易于 使 用 ， 文 档 管理 功能 使 得 访问 者 、 参 与 者 、 内 容 管理 员 更 易于 使 
用 ， 更 易于 管理 、 快 速 部 署 的 目标 。 

2) 不 依赖 于 企业 准备 情况 ， 不 管 文档 管理 方案 如 何 ， 文 档 管理 功能 都 会 在 
规模 性 、 丰 富 功能 深度 、 自 定义 性 和 可 扩展 性 上 提高 性 能 ， 文 档 管理 功能 中 注入 
了 元 数据 管理 并 使 用 元 数据 来 驱动 文档 检索 功能 。 

3) 广泛 参与 ， 企业 中 的 每 个 人 都 可 以 访问 文档 管理 功能 ， 也 可 以 对 功能 进 
行 调整 ， 以 使 每 个 人 能 够 查看 所 需 功 能 。 


9. 3.3 文档 管理 功能 


SharePoint 2007 是 SharePoint 真正 摆脱 其 协作 角色 并 使 客户 将 结构 和 管理 应 
用 于 其 文档 库 的 第 一 个 版 本 。 在 该 版 本 中 ， 建 立 了 许多 关键 文档 管理 基础 架构 : 
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检 入 / 检 出 、 主 要 /次 要 版 本 控制 、 每 个 项 目的 权限 、 内 容 类 型 、 工 作 流 和 回收 
站 。 当 然 , 所 有 这 些 功能 均 与 Office 客户 端 应 用 程序 (例如 Word、Excel 和 
PowerPoint) 紧密 集成 ， 以 使 最 终 用 户 能 够 轻松 地 与 文档 库 进行 交互 ， 用 户 可 以 
在 使 用 这 些 功 能 开始 ， 在 SharePoint 2007 中 创建 高 价值 的 知识 库 。 

SharePoint 2010 中 引入 多 项 主要 文档 管理 功能 和 针对 Office SharePoint 2007 
附带 的 文档 中 心 网 站 模板 的 重要 功能 增强 ,将 所 有 这 些 功 能 一 起 使 用 ， 有 助 于 改 
进 文档 的 创建 和 管理 ， 使 用 元 数据 来 推动 文档 管理 任务 并 支持 文档 检索 ， 支 持 速 
度 较 快 、 可 管理 性 和 可 伸缩 性 较 高 的 大 型 文档 库 。 


9.3.4 文档 集 


1. 文档 集 概述 

在 微软 Office SharePoint Server 2007 内 容 管理 中 ， 无 法 通过 内 置 方式 来 管理 
多 于 单个 文档 的 内 容 。Office SharePoint Server 2007 提供 内 容 包含 关系 的 基本 知 
识 ， 例 如 文件 夹 和 文档 库 ， 但 它们 旨 在 组 织 和 构造 存储 库 ， 而 不 只 是 管理 包含 或 
跨 多 个 文档 的 单个 可 交付 结果 ， 即 工作 产品 。 

文档 集 是 微软 SharePoint Server 2010 中 的 新 投资 领域 ， 旨 在 管理 工作 产品 的 
各 个 方面 。 文 档 集 提供 了 用 户 界面 、 元 数据 选项 、 行 为 和 对 象 模型 元 素 ， 可 填补 
文档 和 网 站 之 间 容 右 的 层次 结构 中 的 间 际 。 在 上 传 文档 集 对 象 时 ， 该 对 象 会 显示 
在 一 个 工作 方式 与 文档 库 类 似 的 Web 部 件 中 。 

在 SharePoint Server 2010 中 使 用 的 自 定 义 Web 部 件 所 需 的 步骤 如 下 : 收集 业 
务 要 求 、 编 写 规范 、 制 定 开发 计划 和 测试 计划 以 及 创建 UI 设计 原型 。 尽 管 自 定 
义 Web 部 件 是 有 形 “ 主 ”可 交付 项 ， 所 有 要 求 如 规范 、 开 发 人 员 计 划 和 测试 计 
划 以 及 UI 设计 原型 都 是 可 交付 结果 的 关键 部 分 。 在 没有 作为 Web 部 件 开发 过 程 
的 一 部 分 生成 的 规划 文档 的 情况 下 ， 此 有 形 可 交付 结果 无 法 以 其 最 终 形式 存在 。 
可 以 使 用 文档 集 功能 管理 与 “ 主 ” 可 交付 项 关联 的 规划 文档 ， 所 有 这 些 文档 都 
是 工作 产品 密 不 可 分 的 一 部 分 。 

许多 组 织 开 发 以 内 容 为 中 心 的 自 定义 应 用 程序 ， 并 且 文 档 集 功 能 则 在 使 组 织 
能 够 蔡 换 其 自 定 义 应 用 程序 。 要 求 包 括 用 于 创建 自 定义 文档 集 内 容 类 型 、 模 板 、 
工作 流 、 记 录 管 理 、 版 本 控制 和 与 功能 区 集成 的 方式 。 

文档 集 是 可 扩展 的 。SharePoint Server 2010 包括 用 于 创建 自 定义 文档 集 内 容 
类 型 的 UI、 用 于 查看 和 创建 文档 集 的 可 自 定义 的 用 户 体验 ， 以 及 用 于 在 文档 集 
上 创建 工作 流 的 工具 。 

2. 文档 集 功 能 

微软 SharePoint Server 2010 提供 对 文档 集 的 内 置 支 持 。 默 认 情 况 下 ， 这 包括 
成 功 管理 工作 产品 所 需 的 所 有 工具 。 文 档 集 是 一 个 可 以 按 原样 使 用 的 内 容 类 型 ， 
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用 户 可 以 通过 在 网 站 内 容 库 中 修改 文档 集 的 设置 来 自 定 义 文档 集 ， 或 在 将 文档 集 
添加 到 文档 库 时 自 定 义 文档 集 。 可 将 文档 集 用 作 自 定义 文档 集 模板 的 基础 。 文 档 
集 支 持 的 功能 如 下 : 

(1)“ 新 建 ” 页 

默认 文档 集 内 容 类 型 的 页 。 使 用 默认 “新 建 ”页 或 创建 并 设置 要 用 于 文档 
集 的 “新 建 ” 页 。 

(2) “欢迎 ”页 及 其 自 定 义 页 

通过 显示 文档 集 的 内 容 及 其 属性 ， 欢 迎 用 户 使 用 文档 集 并 提供 相应 指导 。 默 
认 情 况 下 ， 该 页 用 于 呈现 元 数据 、 说 明和 属于 文档 集 的 文档 的 列表 。 还 可 以 自 定 
义 “ 欢 迎 ”页 以 显示 其 他 信息 。 列 表 所 有 者 可 为 使 用 列表 正在 使 用 的 “文档 集 ” 
内 容 类 型 的 所 有 文档 集 更 改 “ 欢 迎 ” 页 。“ 文 档 集 ”内 容 类 型 文 持 联合 。 在 联合 
某 个 “文档 集 ” 内 容 类 型 时 ， 也 将 联合 属于 该 文档 集 的 “欢迎 ”页 。 可 通过 以 
下 方式 自 定义 “欢迎 ”页 : 中 使 用 文档 设置 UI 自 定义 “欢迎 ”页 的 基本 方面 ; 
@) 使 用 文档 集 设 置 UI 向 页 上 定义 的 Web 部 件 区 域 添加 Web 部 件 ; @ 利 用 微软 
SharePoint Designer 2010 ， 通过 将 Web 部 件 和 控件 添加 到 “欢迎 ” 页 ， 以 更 高 级 
的 方式 自 定义 Web 部 件 页 。 

在 不 使 用 Web 部 件 而 需要 拥有 整个 “欢迎 页 ”时 ， 可 使 用 SharePoint Server 
2010 对 象 模型 。 该 对 象 模型 提供 函数 以 指示 SharePoint Server 2010 使 用 用 户 的 
“欢迎 ”页 ， 而 不 是 使 用 基于 内 置 Web 部 件 的 “欢迎 ”页 。 

对 文档 集 的 “欢迎 ”页 所 做 的 更 改 会 向 下 传递 到 该 内 容 类 型 的 子 级 和 使 用 
该 内 容 类 型 的 位 置 。 这 将 确保 列表 、 文 档 集 实例 和 使 用 “文档 集 ” 内 容 类 型 的 
位 置 ， 在 其 内 容 类 型 副本 中 包含 最 新 的 “欢迎 ”页 。 

“欢迎 ”页 是 Web 部 件 页 ， 并 且 SharePoint Server 2010 包含 两 个 可 自 定义 的 
新 Web 部 件 : (文档 集 属性 Web 部 件 : 类 似 于 “显示 表单 Web 部 件 ”， 只 不 过 
它 采用 作为 指向 其 所 在 页 URL 的 一 部 分 参数 ， 以 确定 要 呈现 的 项 属性 ; @ 文 档 
集 内 容 Web 部 件 : 类 似 于 “列表 视图 Web 部 件 ”， 只 不 过 它 采 用 作为 指向 其 所 
在 页 URL 的 一 部 分 参数 ， 以 确定 要 呈现 的 文件 夹 。 

(3) 版 本 控制 

文档 集 支 持 模板 和 版 本 控制 ， 包 含 版 本 控制 功能 ， 这 些 功 能 是 独立 的 ， 但 可 
与 对 文档 集中 包含 的 文档 可 用 的 版 本 控制 功能 进行 互 操作 。 文 档 集 通过 使 用 常规 
版 本 控制 并 保存 文档 集 的 属性 的 当前 值 ， 来 捕获 一 个 指向 当前 版 本 文档 的 快照 。 
文档 集 版 本 控制 是 附加 的 ， 这 意味 着 它 不 会 蔡 换 各 个 项 的 版 本 控制 ， 而 是 提供 专 
用 于 查看 和 管理 文档 集 生命 周期 的 男 一 层 支 持 。 文 档 集 具有 一 个 “版 本 历史 记 
录 ” 页 ， 用 户 可 使 用 该 页 查看 版 本 历史 记录 并 使 用 早期 版 本 的 文档 集 。 文 档 集 
版 本 是 与 文档 集 关 联 的 一 组 元 数据 ， 包 括 “ 检 入 备注 ”文本 字段 ,文档 集 属性 
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的 摘要 视图 和 对 文档 集 属性 所 做 的 摘要 视图 更 改 。 在 捕获 文档 集 版 本 时 ， 它 还 跟 
踪 此 时 为 “当前 ”的 所 选 文档 的 版 本 。 可 在 Visual Studio 2010 中 创建 模板 ， 可 
通过 版 本 控制 来 捕获 文档 集 在 其 生命 周期 中 不 同时 点 的 状态 、 查 看 其 历史 记录 以 
及 还 原文 档 集 的 早期 版 本 。 

(4) 工作 流 

用 于 创建 带 文档 集 的 工作 流 活动 。 在 SharePoint Designer 2010 中 和 用 户 可 以 
关联 和 运行 基于 SharePoint Server 2010 文件 夹 的 工作 流 。 由 于 文档 集 是 SPFolder 
对 象 的 扩展 ， 此 用 户 可 以 关联 和 运行 其 工作 流 。 若 在 查看 SharePoint Server 
2010 中 的 共享 文件 夹 时 使 用 文档 集 ， 则 可 与 文档 集 “ 欢 迎 ” 功 能 区 上 的 “工作 
流 ” 按 钮 进行 交互 ， 或 从 每 个 文档 集 列 表 项 旁边 的 下 拉 列 表 中 选择 “工作 流 ”。 
然后 ， 可 以 运行 与 文档 集 关 联 的 工作 流 并 查看 工作 流 详情 。 在 包含 文档 的 文档 集 
上 运行 工作 流 不 会 阻止 或 妨碍 在 文档 集 包含 的 其 他 项 上 运行 工作 流 。SharePoint 
Server 2010 提供 了 内 置 工作 流 活动 ， 可 帮助 用 户 在 SharePoint Designer 2010 中 创 
建 在 文档 集 上 运行 的 工作 流 ， 并 在 文档 集中 创建 满足 多 个 方案 要 求 的 项 。 此 外 ， 
这 些 工 作 流 显 示 适 当 的 工作 流 状态 ， 针 对 与 整个 文档 集 交 互 的 工作 流 所 有 者 以 及 
只 使 用 文档 集中 单个 项 的 参与 者 的 体验 。 

(5) 文件 夹 

文档 集 是 一 类 特殊 的 SharePoint Server 2010 文件 夹 ， 它们 继承 并 使 用 SP- 
Folder 的 功能 和 属性 。 它 继承 标准 文件 夹 的 所 有 属性 和 行为 ， 并 添加 用 于 文 持 工 
作 产 品 管理 、 基 本 文件 夹 功能 和 行为 的 逻辑 。 用 户 与 文档 集 交 互 的 方式 类 似 于 它 
们 与 常规 SharePoint 文件 夹 交 互 的 方式 。 对 文档 集 具有 访问 权 的 用 户 可 以 与 文档 
集 的 内 容 进行 交互 ， 包 括 设置 为 与 文档 集 一 起 使 用 的 基于 内 容 类 型 的 任何 文档 ， 
默认 的 或 自 定义 的 “新 建 ” 页 或 “欢迎 ”页 以 及 关联 的 元 数据 。 

3. 文档 集 的 使 用 

有 时 候 , 会 有 一 组 关联 度 很 高 的 文档 ， 它 们 都 属于 某 个 主题 ,或 者 通常 相互 
引用 。 比 如 ， 关 于 某 个 项 目的 一 组 Word 文档 ,或 是 会 议 组 的 SharePoint 相关 的 
幻灯 片 文档 ， 对 于 这 样 一 组 关联 度 很 高 的 文档 ， 在 SharePoint 2007 中 ， 要 么 将 它 
们 放 在 一 个 单独 的 文件 夹 中 ， 要 么 单独 创建 一 个 文档 库存 放 它 们 ，SharePoint 中 
就 可 以 使 用 文档 集 专 门 管理 一 组 关联 度 很 高 的 文档 。 
9.3.5 内容 管 理 器 

内 容 管理 器 是 SharePoint Server 2010 中 的 新 体验 ， 用 来 管理 用 户 上 传 到 网 站 
的 文档 ， 并 使 用 高 级 传送 引擎 和 传送 规则 ， 来 确定 文档 的 保存 位 置 。 

内 容 管 理 器 是 基于 SharePoint 2007 的 记录 中 心 网 站 模板 中 引入 的 文档 传送 功 
能 构建 的 。 如 果 使 用 一 个 SharePoint 网 站 来 存储 部 门 或 团队 的 文档 ， 通 常会 按照 
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想 要 的 结构 ， 预 先 在 网 站 中 建立 好 相应 的 文档 库 和 文件 夹 。 比 如 会 创建 一 个 
“技术 文档 库 ” 来 存放 技术 类 别 的 文档 ， 同 时 创建 一 个 “业务 文档 库 ” 存 放 业 务 
类 别 的 文档 ， 在 “技术 文档 库 中 ”， 还 可 能 按照 编程 语言 的 种 类 建立 诸如 “C”、 
“C+ +”、“C#” 之 类 的 文件 夹 ， 将 技术 文档 按照 它们 所 属 的 类 别 ， 再 放置 到 相 
应 的 文件 夹 中 。 

但 是 ， 无 论 管理 员 将 结构 建立 得 多 么 好 、 多 么 完整 ， 用 户 很 可 能 并 不 会 按照 
文档 实际 的 类 别 使 用 内 容 管理 需 ， 能 帮助 网 站 管理 员 实现 自动 化 的 文档 路 由 和 存 
储 ， 在 用 户 将 文档 上 传 网 站 之 后 ， 内 容 管理 需 会 按照 实现 设置 的 规则 ， 自 动 将 文 
档 移动 到 正确 的 地 方 。 此 功能 是 基于 首先 在 0 值 ce SharePoint Server 2007 中 引入 
的 记录 传送 框架 构建 的 ， 并 在 记录 中 心 和 记录 管理 方案 之 外 将 其 扩展 为 更 常见 的 
文档 管理 方案 和 应 用 程序 。 

内 容 管理 器 的 规则 ， 基 本 上 基于 两 种 判断 : 

1) 文档 的 内 容 类 型 ， 例 如 ， 属 于 “技术 文档 ”类 型 的 文件 移动 到 哪里 ” 属 
于 “业务 文档 ”类 型 的 文件 移动 到 哪里 ” 内 容 管理 咒 规 则 只 能 处 理 继 承 自 “ 文 
档 ” 的 内 容 类 型 ， 这 意味 着 内 容 管理 需 只 能 管理 文件 类 型 的 内 容 ， 而 不 能 处 理 
其 他 列表 项 内 容 类 型 。 

2) 属性 的 值 ， 基 于 第 一 种 判断 条 件 ， 管 理 还 可 以 再 基于 文档 的 属性 设置 判 
断 的 条 件 ， 比 如 “技术 类 别 ” 属 性 的 值 等 于 “Web 程序 ”的 文档 ,移动 到 什么 
位 置 ， 第 二 种 判断 条 件 不 能 独立 于 第 一 种 存在 。 

内 容 管理 咒 是 一 项 网 站 级 别 而 非 网 站 集 级 别 ， 所 以 ， 首 先 需 要 在 网 站 功能 管 
理 中 ,启用 “内 容 管理 器 ”功能 ， 如 图 9-3 所 示 。 








内 容 管理 器 





本 | te 刍 要 提交 至此 内 容 和 到 下 大 的 床 疏 文件 天 的 基于 元 吉 扫 的 讽 风 。 
图 9-3 启动 内 容 管理 器 


在 网 站 中 启用 了 内 容 管理 器 功能 之 后 ,网 。 “ses、 网 站 管理 
站 会 多 出 来 一 个 “放置 库 ” 文 档 库 , 这 个 “ 放 。 让 区 
置 库 ” 是 内 容 管 理 器 的 核心 之 一 。 实 际 上 ， 所 用 户 通知 
有 内 容 管理 器 规则 都 是 应 用 到 “ 放 管 库 "， 然 后 i 
在 网 站 管理 中 ,会 多 出 来 “内 容 管理 器 ”设置 网 站 和 工作 区 
和 “内 容 管理 规则 ”链接 ， 如 图 9-4 所 示 。 工作 流 设 置 

内 容 管理 器 设置 界面 中 ， 是 对 整个 网 站 的 E 
内 容 管理 器 功能 进行 全 局 的 设置 。 如 果 选 择 了 
“将 新 内 容 提交 到 库 ” 选 项 ， 那 么 无 论 用 户 是 将 
文档 上 传 到 网 站 的 什么 地 方 ， 这 个 文档 都 会 被 图 9-4 ”内 容 管理 规则 
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自动 移动 到 “放置 库 ” 中 ， 以 对 其 应 用 规则 。 

如 果 选 中 了 “允许 规则 将 其 他 网 站 指定 为 目标 位 置 ” 选 项 ， 那么 在 规则 中 ， 
就 能 将 上 传 的 文档 移动 到 其 他 网 站 。 但 是 其 他 网 站 的 目标 位 置 ， 必 须 事先 由 管理 
员 在 “管理 中 心 一 一 一 般 应 用 程序 设置 一 一 配置 发 送 到 连接 ”设置 之 后 ,才能 
使 用 。 

自动 创建 子 文件 夹 的 选项 非常 有 用 ， 这 样 可 以 避免 在 一 个 文件 夹 中 ， 存 放 太 
多 的 内 容 。 不 建议 在 一 个 文件 夹 中 ， 存 放 超 过 5000 个 文件 。 

保留 文档 的 审核 日 志和 属性 ， 有 助 于 在 记录 管理 中 对 文档 进行 持续 
管理 。 

“规则 管理 员 ” 可 以 让 管理 员 指 定 哪 些 人 可 以 设置 内 容 管理 器 规则 。 如 果 一 
个 用 户 是 网 站 管理 员 ,， 但 是 并 非 规 则 管理 员 ， 他 也 不 能 管理 内 容 管理 器 规则 。 如 
果 一 个 用 户 是 规则 管理 员 ， 但 并 非 网 站 管理 员 ， 他 仍然 不 能 管理 内 容 管理 器 
规则 。 

接 下 来 ， 就 是 为 内 容 管理 器 创建 规则 。 每 个 规则 都 有 优先 级 ， 优 先 级 高 的 规 
则 会 先 被 执行 ， 这 样 如 果 一 个 文档 符合 多 个 规则 的 条 件 ， 那 么 只 有 优先 级 最 高 的 
规则 会 被 应 用 到 文档 。 

配置 好 了 内 容 管理 器 之 后 ， 当 用 户 在 网 站 中 上 传 了 文档 之 后 ， 系 统 会 自动 提 
示 它 ， 内 容 管理 器 已 经 将 文档 自动 转移 到 了 新 的 地 方 ， 并 且 会 显示 出 文档 所 在 位 
置 的 URL 路 径 。 

有 了 内 容 管理 器 ， 用 户 在 上 传 文档 时 ， 就 不 再 需要 考虑 到 底 将 文档 上 传 到 哪 
个 地 方才 合适 。 文 档 所 在 位 置 的 选择 ， 被 交 给 了 内 容 管理 器 ， 按 照管 理 员 所 设置 
的 规则 ， 对 文档 进行 自动 的 路 由 和 分 类 。 























9.4 数字 资产 管理 





企业 组 织 对 数字 技术 和 数字 媒体 内 容 (如 音频 和 视频 文件 ) 的 使 用 越 来 越 
频繁 ， 通 过 在 SharePoint Server 库 中 存储 数字 媒体 内 容 来 提供 管理 音频 、 视 频 和 
图 像 内 容 类 型 的 功能 ， 以 便 更 好 地 在 企业 内 部 进行 通信 以 及 与 客户 进行 通信 。 
SharePoint Server 2010 提供 针对 小 于 150MB 的 音频 文件 和 视频 文件 的 最 佳 支 持 
(包括 针对 从 图 像 文件 提取 元 数据 的 增强 文 持 ) ， 并 可 文 持 最 大 为 2GB 专用 于 演 
示 和 呈现 的 音频 文件 和 视频 文件 。 


9.4.1 功能 概述 


数字 资产 管理 支持 三 种 数字 媒体 类 型 : 音频 、 视 频 和 图 像 的 接收 、 注 释 、 存 
储 、 检 索 和 呈现 的 功能 。 
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1. 视频 

对 于 视频 ，SharePoint Server 2010 通过 以 下 各 项 支持 向 不 同类 型 的 SharePoint 
Server 2010 页 添加 视频 并 播放 这 些 视频 .: 

1) 一 个 基于 微软 Silverlight 2. 0 构建 的 媒体 播放 器 ， 该 播放 器 支持 由 可 扩展 
应 用 程序 标记 语言 (XAML) 文 持 的 主题 。 

2) 一 个 用 于 资产 库 的 “Video” 内 容 类 型 。 

3) 一 个 可 用 于 将 视频 包含 在 页 和 Web 部 件 页 中 的 “媒体 Web 部 件 ”。 

4) 针对 在 资产 选取 器 中 选择 视频 的 支持 。 

2. 音频 

对 于 音频 ，SharePoint Server 2010 提供 : 

1) 一 个 用 于 资产 库 的 “Audio” 内 容 类 型 ， 该 类 型 支持 音频 文件 的 存储 和 
播放 。 

2) 针对 在 资产 选取 器 中 选择 音频 的 支持 。 

3. 图 像 

对 于 图 像 ，SharePoint Server 2010 提供 : 

一 个 用 于 资产 库 的 “Image” 内 容 类 型 ， 该 类 型 支持 图 像 文件 的 存储 和 
查看 。 


9.4.2 支持 的 方案 


SharePoint Server 2010 中 的 数字 资产 管理 旨 在 文 持 以 下 三 个 主 方案 中 包含 数 
字 媒 体内 容 : 

1. 门户 网 站 上 发 布 的 数字 媒体 内 容 

在 门户 和 Internet 发 布 网 站 上 ， 内 容 提 交通 常 是 受 管 理 的 。 无 论 何 种 内 容 类 
型 ， 大 要 将 内 容 提 交 到 这 些 网 站 中 的 某 个 网 站 ， 则 必须 遵循 或 午 守 可 全 方位 控制 
所 提交 内 容 的 流程 或 策略 ， 包 括 了 解 更 主观 的 编辑 注意 事项 ， 如 内 容 与 网 站 受众 
的 相关 程度 或 更 明确 的 技术 详情 ， 如 压缩 速率 和 文件 格式 。 

针对 查找 和 查看 数字 媒体 内 容 的 导航 ,将 遵循 与 其 他 内 容 类 型 (如 已 编写 
文档 或 图 像 文件 ) 一 样 的 基于 网 站 的 导航 和 查看 方式 。 音 频 和 视频 内 容 通 常会 
以 内 联 方式 与 网 站 上 的 其 他 内 容 ， 如 HTML 文本 一 起 显示 。 

门户 和 Internet 发 布 网 站 会 承载 相对 较 短 的 音频 文件 和 视频 文件 ， 这 些 文件 
很 小 ， 通 常 音 频 文件 不 会 大 于 5MB ， 视 频 文 件 不 会 大 于 25MB。 这 些 网 站 通常 最 
多 承载 几 千 个 音频 或 视频 文件 。 

2. 社区 生成 的 音频 和 视频 网 站 

与 门户 和 Internet 发 布 网 站 相反 ， 社 区 生成 的 音频 和 视频 网 站 采用 不 同 的 方 
法 进行 提交 、 导 航 和 查看 。 
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社区 生成 的 视频 网 站 通常 不 会 管理 提交 。 任 何 用 户 都 可 通过 少许 正式 提交 流 
程 或 不 通过 正式 提交 流程 来 上 传 音频 和 视频 文件 。 服 务 质量 由 强制 实施 的 技术 约 
束 (如 文件 大 小 限制 ) 管理 。 确 保 数字 媒体 无 法 超过 某 个 特定 文件 大 小 以 保持 
一 致 性 ， 并 有 助 于 确保 网 站 内 容 可 靠 执行 。 

社区 生成 的 音频 和 视频 网 站 的 用 户 可 基于 音频 或 视频 文件 元 数据 进行 搜索 或 
导航 来 查找 数字 媒体 。 例如 ， 使 用 SharePoint Server 2010 或 基于 微软 ASP. NET 
的 Web 部 件 来 承载 视频 内 容 的 网 站 将 通过 使 用 与 每 个 视频 文件 关联 的 元 数据 组 
织 和 演示 视频 。 通 过 使 用 元 数据 组 织 和 演示 视频 ， 使 网 站 能 够 使 用 静态 和 动态 视 
频 演示 模型 . 

当 URL 对 用 户 可 读 且 可 选 时 ,媒体 是 静态 的 。 

在 选 定 一 个 媒体 播放 器 但 未 提供 显 式 媒体 URL 时 ,媒体 是 动态 的 。 该 播放 
器 在 运行 时 会 收 到 一 个 媒体 URL 并 在 客户 端 计 算 机 上 显示 来 自 该 URL 的 媒体 ， 
而 无 需 回 发 到 服务 器 。 

虽然 承载 社区 生成 的 视频 网 站 通常 具有 较 低 的 文件 大 小 限制 ， 该 限制 通常 小 
于 25MB ， 但 可 承载 数 百 万 个 视频 。 承 载 音 频 文件 (通常 为 播客 ) 的 社区 网 站 将 
管理 大 小 介 于 5MB 和 75MB 之 间 ， 且 运行 时 间 介 于 几 分 钟 到 一 小 时 甚至 一 小 时 
以 上 的 文件 。 

3. 学 习 和 培训 网 站 

承载 说 明 性 视频 的 网 站 ， 如 门户 和 Internet 发 布 网 站 将 管理 提交 。 这 些 网 站 
所 承载 的 视频 通常 是 由 专家 专门 制作 、 提 交 和 标记 的 。 有 时 ， 学 习 和 培训 视频 会 
包含 元 数据 (如 关键 字 ) 、 附 带 的 文本 脚本 和 同步 的 微软 PowerPoint 演示 文稿 。 

学 习 和 培训 网 站 将 管理 针对 视频 内 容 和 整个 网 站 结构 的 导航 和 查看 选项 以 及 
行为 。 社 区 反馈 机 制 (如 评分 ) 也 可 能 会 纳入 组 织 用 来 管理 学 习 和 培训 网 站 的 
综合 方法 中 。 

该 类 型 通常 会 承载 几 千 个 中 型 -大 型 视频 (大 小 介 于 100MB 和 500MB 之 
间 )。 音 频 文件 通常 较 小 ， 其 大 小 通常 介 于 50MB 和 150MB 之 间 。 


9. 4.3 编程 模型 


SharePoint Server 2010 包含 几 个 新 类 型 和 一 个 客户 端 对 象 模 型 。 

数字 资产 管理 的 新 类 型 包括 : 

1) MediaPlayerExtensions: 提供 用 于 为 媒体 播放 器 设置 源 模板 的 方法 。 

2) Mediafield: 存储 一 个 MediaFieldValue 对 象 。 

3) MediaFieldValue: MediaWebPart Web 控件 支持 静态 和 动态 媒体 资源 来 源 ， 
包括 以 下 参数 : MediaURL、PreviewUrl、 标 题 、 自 动 播放 、 状 态 (内 联 、 弹 出 或 
全 屏 显 示 ) 。 
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4) InsertMediaRibbonbutton : 向 功能 区 添加 一 个 媒体 按钮 ， 按 钮 类 型 如 下 : 

GD MediaDiaplayMode: MediaWebPart Web 部 件 的 状态 ， 状 态 选 项 包括 内 联 、 
弹出 覆盖 和 全 屏 显 示 。 在 内 联 模式 中 ， 当 首先 单 击 网 页 中 符 套 的 媒体 播放 器 上 的 
“播放 ”时 ，SharePoint Server 2010 会 播放 网 页 中 内 联 的 媒体 ， 可 在 网 页 中 将 媒 
体 与 其 他 HTML 内 容 一 起 查看 。 在 弹出 覆盖 模式 中 ， 当 媒体 播放 器 处 于 还 原状 
态 时 ， 该 播放 器 会 弹出 并 覆盖 页 上 的 父 UI。 在 此 状态 下 ， 可 将 媒体 播放 器 最 大 
化 为 全 屏 显 示 模 式 ， 或 关闭 媒体 播放 器 并 返回 内 联 模式 。 在 最 大 化 媒体 播放 器 
时 ， 将 以 全 屏 显 示 模 式 播 放 视 频 。 

@) MediaFileControl: 支持 将 MediaWebPart 呈现 为 字段 控件 ， 并 提供 可 配置 
的 属性 。 例 如 ， 可 以 修改 此 控件 ， 将 MediaWebPart 类 型 配置 为 自动 播放 或 循环 
播放 直到 停止 。 页 面 布局 设计 器 还 可 以 为 媒体 字段 控制 配置 限制 。 

@) MediaWebPart: 提供 在 SharePoint 网 站 上 承载 音频 和 视频 文件 的 标准 方 
法 ,包括 播放 、 和 暂停 和 停止 ;向 前 搜索 和 向 后 搜索 ; 音量 控制 ， 显示 大 小 控制 ， 
可 允许 在 默认 标准 大 小 和 全 屏 显 示 模 式 之 间 切 换 ; 标题 ， 可 显示 所 选 音频 或 视频 
文件 的 标题 ， 关 闭 ， 可 关闭 媒体 播放 器 并 将 其 返回 库 视 图 ; 全 屏 显 示 ， 可 展开 播 
放 需 以 便 使 用 全 屏 显 示 模 式 播 放 ， 提 供 对 于 在 客户 端 上 进行 数字 资产 管理 编程 非 
常 有 用 的 ECMAScript 文件 。 

(4) Mediaplayer. js: 数字 资产 管理 客户 端 对 象 模型 ， 包括 针对 媒体 播放 融 
Web 部 件 的 逻辑 。 





























































































































9.5 记录 管理 和 合 规 性 


9. 5.1 记录 管理 


记录 管理 包括 用 于 将 文档 标识 为 记录 的 功能 ， 以 及 在 这 些 记 录 的 整个 生命 周 
期 内 管理 它们 的 方法 : 标识 和 创建 记录 、 电 子 数据 展示 或 保留 、 审 核 、 过 期 和 处 
理 。 在 SharePoint Server 2010 中 ， 记 录 管 理 支持 管理 存档 或 存储 库 中 的 记录 ， 并 
支持 就 地 记录 管理 。 

SharePoint Server 2010 提供 了 专用 于 管理 记录 的 功能 。 记 录 是 企业 或 组 织 很 
重要 的 任意 文档 ， 它 由 业务 流程 来 管理 。 在 SharePoint Server 2010 中 ， 对 记录 管 
理 和 电子 数据 展示 功能 进行 了 增强 ， 使 其 具有 以 下 新 功能 : 多 阶段 策略 改进 、 可 
广泛 访问 的 电子 数据 展示 、 记 录 中 心 模板 、 可 在 任何 网 站 上 启用 的 记录 中 心 的 组 
件 功能 、 基 于 位 置 的 过 期 计划 。 

SharePoint Server 2010 提供 除 基于 存档 的 记录 管理 之 外 的 解决 方案 。 记 录 管 
理 功能 现在 不 是 完全 基于 记录 中 心 模型 ， 而 是 允许 用 户 选择 是 使 用 记录 中 心 存档 
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方法 ， 还 是 在 企业 中 记录 所 在 位 置 对 其 进行 管理 。 这 一 新 功能 被 称 为 “就 地 记 
录 管 理 ” 并 位 于 网 站 集 级 别 。 

记录 管理 是 根据 企业 策略 用 统一 方式 收集 、 管 理 和 处 置 公 司 记录 (被 视 为 
对 公司 历史 、 知 识 或 法 律 保护 十 分 重要 的 信息 ) 的 过 程 。 这 些 策略 是 根据 组 织 
所 从 事 的 工作 类 型 、 所 面临 的 法 律 风 险 及 所 遵守 的 法 律 规章 制度 制定 的 。Share- 
Point Server 2010 为 在 组 织 中 创建 和 支持 正规 记录 管理 功能 引入 了 一 组 新 的 功能 。 

1) 文档 ID: 可 为 每 个 文档 指定 一 个 唯一 标识 符 ， 即 使 在 对 文档 进行 存档 
时 ， 文 档 也 始终 带 有 标识 符 。 这 样 ， 不 管 将 文档 移 至 何人 处 ， 也 可 按 ID 轻松 引用 
记录 。 

2) 多 阶段 保留 : 保留 策略 可 以 包含 多 个 阶段 ， 从 而 允许 将 整个 文档 生命 周 
期 指定 为 一 个 策略 ， 例 如 ， 每 年 检查 合同 ， 并 在 7 年 后 删除 合同 。 

3) 基于 项 目的 审核 报告 : 可 以 生成 一 个 有 关 单 个 记录 的 自 定 义 审 核 报告 。 

4) 具有 层次 结构 的 文件 规划 : 可 以 创建 具有 和 较 深层 次 的 文件 夹 结构 ， 并 管 
理 该 层次 结构 (或 继承 自 父 文件 夹 ) 中 每 个 文件 夹 的 保留 策略 。 

5) 文件 规划 报告 : 可 以 生成 状态 报告 ， 以 显示 文件 规划 各 阶段 中 项 目的 数 
量 ， 以 及 该 规划 中 各 个 节点 的 汇总 保留 策略 。 


9. 5.2 合 规 性 


SharePoint Server 2010 中 的 合 规 性 与 强制 实施 用 于 降低 业务 风险 的 规则 有 关 。 
风险 可 能 以 多 种 形式 出 现 : 法 律 、 信 息 披露 、 成 本 超支 、 政 府 法 规 等 。 通 常 ， 管 
理 层 会 雇用 记录 经 理 、 合 规 性 主管 和 律师 来 建立 和 实施 风险 监管 。 为 了 确定 
SharePoint Server 2010 支持 的 用 户 角色 ， 记 录 经 理 这 一 术语 将 描述 管理 风险 的 
人 员 。 

在 内 容 管理 中 ， 合 规 性 包括 四 个 主要 方案 。 在 SharePoint Server 2010 中 的 默 
认 情 况 下 可 用 的 功能 支持 下 列 儿 种 方案 : 

1) 标识 和 管理 记录 : 在 此 方案 中 ,记录 经 理 将 标识 重要 的 业务 文档 ( 记 
录 ) 并 将 业务 流程 附加 到 这 些 文档 。 例 如 ， 在 将 业务 文档 标识 为 记录 后 ， 用 户 
可 能 无 法 编辑 或 删除 它 。 

2) 电子 数据 展示 和 保留 项 : 在 电子 数据 展示 中 ， 记 录 经 理 将 查找 并 锁定 与 
诉讼 相关 的 内 容 。 例 如 ， 如 果 其 他 方 就 公司 使 用 电子 数据 展示 的 方式 起 诉 公司 ， 
则 记录 经 理 需 要 找到 并 处 理 包含 词 “ 电 子 数据 展示 ”的 所 有 内 容 。 

3) 审核 : 在 审核 过 程 中 ， 记 录 经 理 将 跟踪 对 内 容 执 行 特 定 操 作 的 人 员 。 审 
核 方案 通常 源 于 法 务 调查 ， 并 在 对 内 容 执 行 操作 后 发 生 。 

4) 保留 和 过 期 : 保留 和 过 期 策略 旨 在 通过 确保 组 织 将 内 容 保留 一 段 特定 时 
间 并 在 过 期 日 期 删除 内 容 ， 以 此 来 降低 电子 数据 展示 的 成 本 。 保 留 项 包括 内 容 生 
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命 周 期 内 的 关键 任务 ， 如 计划 事件 和 删除 事件 。 

为 了 支持 所 有 这 些 方案 ，SharePoint Server 2010 和 微软 Office 2010 中 的 功能 
专用 于 支持 合 规 性 。 例 如， 文档 内 容 类 型 是 一 类 可 使 用 信息 策略 管理 的 对 象 。 通 
过 使 用 Office 2010 客户 端 应 用 程序 (包括 新 文档 集 功 能 ) 创建 的 所 有 类 型 的 文 
档 都 支持 合 规 性 和 记录 管理 。 


9. 5.3 记录 管理 编程 模型 


记录 管理 包括 可 用 于 创建 自 定义 记录 管理 解决 方案 的 服务 器 API 和 Web 服 
务 。 最 常用 于 编写 自 定 义 记 录 管 理应 用 程序 的 命名 空间 和 类 型 ， 可 在 下 面 的 链接 
中 找到 详细 的 描述 : http : //msdn. microsoft com/zh-cn/library/ee557329. aspx。 








9.6 电子 数据 展示 管理 





电子 数据 展示 也 可 用 作 网 站 级 功能 ， 可 在 任意 位 置 将 其 激活 ， 并 可 用 于 从 整 
个 网 站 集 向 电子 数据 展示 保留 项 添加 文档 。 

电子 数据 展示 是 通过 其 查找 、 保 留 和 保存 与 特定 法 庭 案 例 相 关 的 文档 的 过 
程 。 它 有 时 也 称 作 “保留 ”功能 。 在 SharePoint Server 2010 中 ， 可 将 电子 数据 展 
示 作 为 任何 网 站 上 的 网 站 功能 激活 。 使 用 电子 数据 展示 功能 可 为 整个 网 站 集中 的 
电子 数据 展示 添加 要 保留 的 项 ， 还 可 使 用 此 功能 管理 保留 项 ， 并 在 跨 多 个 网 站 集 
的 存储 库 中 搜索 内 容 。 可 指定 搜索 查询 并 计划 要 添加 到 保留 项 的 所 有 项 目 ， 也 可 
以 将 每 个 项 目 分 别 添加 到 保留 项 。 

1. 电子 数据 无 处 不 在 

一 些 法 庭 案例 需要 能 够 在 不 同位 置 进行 搜索 ， 而 记录 中 心 不 是 长 期 存档 。 因 
此 ， 用 户 可 能 决定 使 用 记录 中 心 来 存储 所 有 重要 文档 ,但 对 协作 空间 使 用 自 定义 
网 站 模板 ; 可 能 需要 在 协作 空间 中 使 用 电子 数据 展示 。 知 在 多 个 位 置 使 用 多 个 解 
决 方案 管理 记录 ， 则 需要 可 搜索 企业 中 任意 位 置 记录 的 电子 数据 展示 解决 方案 : 
电子 数据 展示 无 处 不 在 。 内 部 保留 基础 结构 功能 在 任何 位 置 都 启用 了 电子 数据 
展示 。 

默认 情况 下 ， 会 在 每 个 SharePoint Server 2010 网 站 中 激活 内 部 保留 基础 结构 
功能 。 在 激活 此 功能 之 后 ， 网 站 上 的 所 有 功能 均 可 用 于 网 站 中 要 置 于 保留 状态 的 
项 目 。 以 下 项 目 可 采用 与 保留 项 相关 的 特定 操作 

1) 搜索 和 处 理 作 业 可 向 保留 项 添加 项 目 。 

2) 解除 限制 作业 可 从 保留 项 中 删除 项 目 。 

3) 可 查看 与 项 目 相关 的 保留 数据 ， 并 在 保留 项 中 添加 或 删除 项 目 。 

4) 由 于 默认 情况 下 会 在 任何 位 置 都 启用 保留 基础 结构 功能 ， 因 此 可 搜索 整 
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个 网 站 集 ， 并 将 结果 置 于 保留 状态 ， 而 不 激活 子 网 站 中 的 Hold 功能 。 

5) 利用 Hold 功能 ， 可 在 启用 了 该 功能 的 网 站 中 定义 和 管理 保留 项 。 

2. 保留 报告 

保留 报告 由 Microsoft. Office. RecordsManagement Reporting 命名 空间 中 的 类 和 
成 员 来 创建 和 管理 ， 保 留 Report 对 象 列 出 了 新 数据 和 已 更 改 的 数据 。 由 于 每 个 
保留 项 均 可 与 多 个 报告 关联 ， 因 此 在 多 网 站 集 存 储 库 中 ， 每 个 网 站 集 都 具有 一 个 
报告 。 如 果 有 多 个 项 目 处 于 保留 状态 ， 则 必须 将 报告 拆 分 为 多 个 部 分 。 

处 于 目标 位 置 的 保留 报告 包含 在 源 位 置 上 运行 的 搜索 结果 。 当 计时 器 作业 处 
理 “ 搜 索 和 发 送 到 另 一 个 站 点 ”操作 时 ， 它 会 调用 Web 服务 并 传人 有 关 它 执行 
的 查询 数据 ， 如 已 搜索 的 网 站 、 已 运行 的 查询 以 及 执行 查询 的 日 期 。 面 向 公众 的 
保留 功能 在 网 站 级 别 工 作 ， 这 使 用 户 能 够 在 网 站 集中 创建 多 个 分 层 保 留 项 列表 。 
在 创建 此 列表 后 ， 该 功能 会 从 网 站 父 链 中 的 所 有 保留 项 列表 中 拖 出 数据 。 

即使 所 选 保留 项 中 没有 内 容 ， 也 会 生成 保留 Report 对 象 。 如 果 报 告 未 包含 
内 容 ， 则 SharePoint Server 2010 将 引发 ReportEmptyException 异常 。 

3. 搜索 

基于 列表 项 属性 (如 日 期 ) 的 搜索 是 电子 数据 展示 方案 中 的 典型 搜索 。 例 
如 ， 可 能 需要 查找 在 某 个 特定 日 期 前 所 签署 的 所 有 合同 。 此 外 ，SharePoint Server 
2010 中 支持 内 容 分 发 方案 。 在 此 方案 中 ， 内 容 的 集中 程度 较 低 且 更 加 分 散 ， 这 
使 得 能 够 指定 准确 查询 和 电子 数据 展示 搜索 范围 变 得 更 加 重要 。 构 建 电子 数据 展 
示 搜 索 是 为 了 提供 范围 、 缩 放 、 扩 展 性 、 查 询 重 用 和 跨 多 个 网 站 集 进行 搜索 的 
能 力 。 

1) 将 电子 数据 展示 搜索 的 范围 限定 为 特定 网 站 。 

2) 缩放 目标 ， 将 10000 项 搜索 结果 置 于 保留 状态 。 

3) 使 用 SharePoint Server 搜索 之 外 的 搜索 引擎 ， 执 行 电子 数据 展示 搜索 。 

4) 访问 对 特定 保留 项 执行 的 搜索 查询 的 列表 。 

5) 更 轻松 地 读 取 查询 ， 查 询 对 用 户 可 读 且 易于 重新 生成 。 

6) 搜索 可 路 多 个 网 站 集 ， 这 包括 能 够 为 搜索 包含 的 所 有 网 站 集 定 义 一 个 保 
留 项 列表 ， 能 够 向 保留 项 添加 多 个 网 站 集中 的 搜索 结果 ， 以 及 能 够 将 搜索 范围 限 
定 为 多 个 网 站 集 存储 库 中 的 一 个 网 站 集 。 

4. 保留 内 容 和 非 保留 内 容 的 分 离 

电子 数据 展示 和 保留 功能 包括 将 保留 内 容 与 非 保留 内 容 分 隅 开 的 能 力 。 可 以 
将 搜索 结果 复制 到 记录 中 心 ， 以 便 在 其 中 传送 这 些 搜索 结果 并 将 它们 与 其 他 记录 
放置 在 一 起 。 还 可 以 配置 该 功能 ， 以 将 搜索 结果 复制 到 记录 中 心 ， 并 将 它们 与 现 
有 记录 分 隔 开 。 

若 要 将 保留 内 容 与 非 保留 内 容 分 隔 开 ， 可 以 设置 一 个 专用 于 电子 数据 展示 的 
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单独 记录 中 心 ， 也 可 以 创建 一 个 自 定 义 传送 器 ， 以 检查 传人 的 保留 属性 ， 并 根据 
属性 值 将 它们 传送 到 一 个 特殊 库 。 

通过 创建 一 个 单独 的 专用 于 电子 数据 展示 的 记录 中 心 ， 可 成 功 地 将 保留 内 容 
与 企业 记录 分 隔 开 ， 但 不 会 根据 放置 此 内 容 的 保留 项 将 内 容 传 送 到 特殊 位 置 。 
此 方法 有 一 个 缺点 ， 即 需要 为 要 单独 保留 的 每 类 属性 提供 一 个 单独 的 记录 
中 心 。 

5. 多 网 站 集 存储 库 

作为 一 个 常规 基础 结构 功能 ，SharePoint Server 2010 包括 将 多 个 网 站 集合 并 
为 一 个 订阅 的 方法 。 对 于 电子 数据 展示 而 言 ， 订 阅 可 满足 要 组 合 在 一 起 的 网 站 集 
的 大 部 分 (而 非 所 有 ) 需求 。 因 此 ， 创 建 一 个 称 作 多 网 站 集 存 储 库 的 订阅 的 子 
类 型 ， 它 不 仅 与 订阅 共享 通用 功能 ， 而 且 还 提供 电子 数据 展示 所 需 的 唯一 
功能 。 

多 网 站 集 存 储 库 包 括 一 个 用 于 枚 举 网 站 集 的 API、 一 个 用 于 配置 跨 整 个 多 网 
站 集 存储 库 的 设置 的 网 站 、 一 种 用 于 将 组 ID 传递 给 在 可 分 区 的 多 个 组 中 共享 的 
服务 的 方法 ， 以 及 一 种 用 于 从 因 其 他 原因 而 组 合 在 一 起 的 多 个 网 站 集中 唯一 的 区 
分 多 网 站 集 存储 库 ( 如 宿主 环境 ) 的 方法 。 

“订阅 设置 ”页 包含 一 个 指向 “发 现 和 保留 设置 ”的 链接 ， 这 是 一 个 用 于 为 
当前 订阅 配置 电子 数据 展示 和 保留 设置 的 页 。 如 果 文 档 和 记录 中 心 跨 多 个 网 站 集 
以 支持 电子 数据 展示 ， 则 选择 将 所 有 网 站 集 组 合 到 一 个 存储 库 中 。 通 过 将 所 有 网 
站 集 绑 定 到 一 个 存储 库 中 ， 可 为 整个 订阅 启用 一 个 集中 保留 列表 、 一 个 报告 库 和 
一 个 搜索 页 。 还 可 以 指定 : 是 否 搜索 整个 订阅 、 主 保留 列表 所 在 的 网 站 集 、 用 于 
预览 搜索 的 注册 搜索 服务 中 的 范围 。 在 将 网 站 组 指定 为 多 网 站 集 存储 库 并 在 集 线 
需 中 启用 “保留 ”后 ， 即 完成 了 对 多 网 站 集 存 储 库 的 配置 。 

6. 电子 数据 展示 的 扩展 

可 以 扩展 电子 数据 展示 ， 以 支持 跨 多 个 网 站 的 搜索 和 保留 操作 。 可 以 指定 需 
要 搜索 所 有 可 用 的 网 站 集 、 查 询 该 范围 以 及 在 多 个 网 站 集 范围 的 所 有 搜索 结果 上 
放置 一 个 保留 项 。 

为 了 跨 多 个 网 站 集 ，SharePoint Server 2010 在 多 网 站 集 存储 库 中 每 个 网 站 
集 上 创建 一 个 异步 工作 项 ， 然 后 将 搜索 查询 和 保留 传递 到 这 些 工作 项 。 每 个 网 
站 集 将 单独 处 理 保留 请 求 ， 并 发 送 包含 范围 内 每 个 网 站 集 的 结果 的 单独 电子 
邮件 。 

分 发 报告 体系 结构 : 每 个 网 站 集 都 生成 一 个 有 关 该 网 站 集中 处 于 保留 状态 的 
项 目的 Report 对 象 ， 这 些 报告 都 将 存储 在 中 央 集 线 需 的 保留 报告 集合 中 。 

为 了 在 多 网 站 集 存储 库 中 局 用 电子 数据 展示 搜索 ， 每 个 网 站 都 会 标识 自身 是 
否 为 多 网 站 集 的 一 部 分 。 此 外 ， 多 网 站 集 存 储 库 中 的 每 个 “搜索 并 添加 到 保留 ” 
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页 会 标识 范围 内 所 有 网 站 集 的 列表 和 所 有 保留 项 的 列表 ， 并 可 在 多 网 站 集 存储 库 
中 限制 对 这 些 列表 的 结果 预览 。 

7. 多 网 站 集 存储 库 中 的 搜索 

如 前 所 述 ，SharePoint Server 2010 会 锁定 “搜索 并 添加 到 保留 ”页 ， 以 便 仅 
网 站 集 管理 员 可 访问 它 。 在 将 范围 扩展 到 多 个 网 站 集 时 ， 此 级 别 的 访问 控制 将 不 
够 用 某 个 网 站 集 的 管理 员 无 法 查看 其 他 网 站 集中 的 所 有 内 容 。 如 果 租 户 管理 员 
明确 选择 启用 跨 多 网 站 集 存储 库 的 搜索 ， 则 特权 提升 是 可 接受 的 。 但 是 ，Share- 
Point Server 2010 会 告知 在 多 网 站 集 存储 库 中 启用 电子 数据 展示 的 用 户 ,保留 列 
表 的 网 站 上 任何 网 站 集 管理 员 都 可 访问 订阅 中 的 所 有 项 目 。 

















9.7 元 数据 管理 





元 数据 最 本 质 、 最 抽象 的 定义 就 是 关于 数据 的 数据 ， 主 要 用 来 描述 数据 属性 
的 信息 ， 用 来 支持 如 指示 存储 位 置 、 历 史 资 料 、 资 源 寻 找 、 文 件 记 录 等 功能 。 企 
业 元 数据 管理 是 SharePoint Server 2010 中 引入 的 一 组 功能 ， 它 使 分 类 学 家 、 图 书 
管理 员 和 管理 员 能 够 在 企业 中 创建 并 管理 术语 和 术语 集 。 

元 数据 在 SharePoint Server 2010 中 随处 可 见 。 托 管 元 数据 功能 提供 了 用 于 在 
企业 内 部 创建 和 管理 元 数据 的 基础 结构 和 工具 。 管 理 员 、 分 类 人 员 和 用 户 可 使 用 
元 数据 管理 需 来 创建 术语 的 平面 或 分 层 列表 ， 这 些 列表 将 保存 在 术语 存储 中 。 元 
数据 功能 支持 将 自 定义 属性 与 每 个 术语 关联 、 为 术语 指定 语言 以 及 将 术语 组 织 》 
术语 集 。 同 时 ， 它 还 提供 用 于 区 分 、 重 用 、 合 并 和 弃 用 术语 的 功能 。 

企业 元 数据 或 托管 元 数据 是 集中 管理 的 术语 的 分 层 集 合 ， 可 以 定义 这 些 术 
语 ， 然 后 在 整个 SharePoint Server 2010 和 其 他 Office 2010 应 用 程序 中 将 其 用 作 元 
数据 。 此 元 数据 是 “托管 ”元 数据 ， 因 为 术语 和 术语 集 是 独立 于 需要 它们 的 列 
或 字段 进行 管理 的 。 

Sharepoint Server 2010 使 用 新 的 托管 元 数据 服务 提供 一 组 功能 ， 使 组 织 可 以 
在 整个 企业 中 一 致 地 管理 分 类 和 元 数据 ， 从 而 更 加 高 效 地 管理 文档 、 记 录 、 数 字 
资产 和 已 发 布 的 网 页 内 容 。 


9.7.1 托管 元 数据 概念 


托管 元 数据 是 基于 术语 和 术语 集 的 概念 。 术 语 是 可 与 SharePoint Server 2010 
中 的 项 关联 的 词 或 短语 ， 术 语 集 是 相关 术语 的 集合 。 托 管 元 数据 是 可 以 独立 于 列 
来 单独 创建 和 管理 术语 和 术语 集 的 。 

术语 分 为 托管 术语 和 企业 关键 字 : 托管 术语 一 般 是 预定 义 的 ， 只 能 由 具有 适 
当权 限 的 用 户 创建 并 且 通 常 以 层次 结构 的 形式 组 织 ; 企业 关键 字 ， 只 是 一 些 已 添 




















第 9 章 微软 的 SharePoint .187 . 





加 到 SharePoint Server 2010 项 中 的 词 或 短语 。 所 有 企业 关键 字 都 是 一 个 名 为 “ 关 
键 字 集 ” 的 非 分 层 术 语 集 的 一 部 分 。 托 管 术 语 和 企业 关键 字 存 储 在 一 个 称 作 
“术语 库 ” 的 数据 库 中 。 

术语 集 有 本 地 和 全 局 之 分 。 本 地 术语 集 是 在 网 站 集 的 上 下 文中 创建 的 。 例 
如 ， 如 果 向 一 个 文档 库 中 的 列表 添加 一 个 列 ， 然 后 创建 一 个 此 列 将 绑 定 到 的 新 术 
语 集 ， 则 新 术语 集 是 包含 该 文档 库 的 网 站 集 的 本 地 术语 集 。 全 局 术语 集 是 在 网 站 
集 的 上 下 文 外 部 创建 的 。 例 如 ， 术 语 库 管理 员 可 以 创建 一 个 名 为 “Human 
Resources” 的 术语 集 组 ， 并 指派 一 个 人 来 管理 此 术语 集 组 ,该 组 管理 员 将 在 
“Human Resources” 术语 集 组 中 创建 与 “Human Resources” 相 关 的 术语 集 
(如 职务 和 工资 等 级 ) 。 用 户 可 以 仅 查看 全 局 术语 集 和 用 户 网 站 集 的 本 地 术 
语 集 。 


9.7.2 托管 元 数据 的 使 用 


使 用 托管 元 数据 之 前 ， 先 要 创建 术语 。SharePoint Server 2010 包含 一 个 术语 
库 管 理工 具 ， 用 于 创建 和 管理 术语 集 。 如 果 具 有 适当 的 权限 ， 则 可 使 用 术语 库 管 
理工 具 执 行 : 创建 或 删除 术语 集 、 添 加 、 修 改 或 删除 术语 、 以 层次 结构 的 形式 组 
织 术 语 集中 的 术语 、 定 义 同义词 、 导 和 术语， 还 可 以 通过 将 企业 关键 字 移动 到 术 
语 集中 ， 使 这 些 关键 字 成 为 托管 术语 。 

创建 术语 之 后 ， 就 可 以 使 用 术语 。 列 是 列表 中 用 于 存储 有 关 SharePoint 
Server 2010 项 的 信息 的 位 置 。 在 定义 一 个 列 时 ， 用 户 可 以 为 该 列 提供 一 个 名 称 ， 
指定 该 列 的 类 型 并 提供 依赖 于 列 类 型 
的 其 他 信息 。 Column name: 


[rype af Cog 
SharePoint Server 2010 引入 了 一 个 : ee : 
The type. of inforrmation in this:column 1s: 


名 为 “ 托管 元 数据 ” 的 新 列 类 型 。 在 © Single line of text 
创建 一 个 托管 元 数据 列 时 ， 用 户 可 指 全 Multiple lines of text 
定 必须 从 中 获取 该 列 的 值 的 术语 本 3 thoice en Hse tromy 
i 、 Number i, 二 Di IDDy 
在 希望 用 户 提供 列表 项 的 信 息 以 及 术 (Currency (4, 于 €) 
语 集中 包含 的 信息 的 有 效 值 时 , 请 使 | 员 Basarime 
ee a Lookup tintormation already on this site 
用 托管 元 数据 列 。 创 建新 的 内 容 类 型 | ovo oa 
或 修改 现 有 内 容 类 型 ， 然 后 将 托管 元 | Cperson or Group 
数据 列 添加 到 内 容 类 型 。 如 图 9-5 所 和 or Rioture 
有 i 全 calculated tcalculation based on other 
不 ， 在 某 客户 站 点 的 文档 库 中 新 增加 © External Data 
一 个 新 列 ， 该 列 的 类 型 为 托管 元 数据 | Managed Metadats 
ee 
( Managed Metadata) 。 


若 用 户 创 建 或 上 载 某 个 类 型 的 新 图 9-5 ”托管 元 数据 
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SharePoint Server 2010 项 ， 而 该 项 的 列 需 要 值 ， 则 用 户 必 须 提 供 值 。 如 果 该 列 是 
一 个 托管 元 数据 列 ， 则 会 显示 托管 元 数据 控件 ， 用 户 将 与 此 控件 进行 交互 以 输入 
值 。 利 用 托管 元 数据 控件 ， 用 户 可 以 键入 一 个 值 或 通过 分 层 浏览 与 该 列 关 联 的 术 
语 集 来 选择 一 个 值 。 如 果 用 户 开 始 键 入 一 个 值 ， 则 此 控件 会 显示 关联 术语 集中 以 
用 户 键入 的 字符 开头 的 所 有 术语 。 术 语 集 的 名 称 和 术语 在 层次 结构 中 所 处 的 位 置 
随 术语 本 里 一 起 指示 。 如 果 列 的 定义 允许 多 个 值 ， 则 用 户 可 以 选择 多 个 术语 。 如 
果 术 语 集 和 列 的 定义 都 允许 添加 新 术语 ， 则 用 户 还 可 以 创建 新 术语 并 将 其 插入 到 
术语 集 的 层次 结构 中 的 适当 位 置 。 

SharePoint Server 2010 包含 一 个 名 为 “企业 关键 字 ” 的 预定 义 的 列 ， 可 以 向 
内 容 类 型 添加 此 列 。 当 用 户 向 “企业 关键 字 ” 列 添加 值 时 ,会 显示 企业 关键 字 
控件 ， 用 户 与 该 控件 进行 交互 以 输入 值 。 企 业 关 键 字 控件 的 行为 与 托管 元 数据 
控件 的 行为 类 似 ， 只 不 过 企业 关键 字 控 件 允 许 用 户 选 择 企业 关键 字 和 托管 
术语 。 

当 用 户 开始 键入 一 个 值 时 ， 此 控件 会 显示 全 局 术语 集 和 用 户 网 站 集 的 本 地 术 
语 集中 以 用 户 键入 的 字符 开头 的 术语 ， 还 会 显示 术语 所 在 的 术语 集 和 术语 在 层次 
结构 中 所 处 的 位 置 。 通 常 还 会 提供 一 个 用 于 输入 新 企业 关键 字 的 选项 。 如 果 用 户 
输入 一 个 新 的 企业 关键 字 ， 则 该 企业 关键 字 将 添加 到 关键 字 集 。 默 认 情 况 下 ， 
“企业 关键 字 ” 列 允许 多 个 值 。 


9.7.3 使 用 托管 元 数据 的 优越 性 


使 用 托管 元 数据 的 优越 性 如 下 : 

1. 更 一 致 地 使 用 术语 

托管 元 数据 使 得 对 术语 的 使 用 以 及 对 添加 到 SharePoint Server 2010 项 的 企业 
关键 字 的 使 用 更 为 一 致 。 用 户 可 以 预定 义 术语 ， 并 可 以 只 人 允许 授权 用 户 添加 新 术 
语 。 此 外 ， 用 户 可 以 禁止 将 其 自己 的 企业 关键 字 添 加 到 项 ， 并 要 求 他 们 使 用 现 有 
的 企业 关键 字 。 托 管 元 数据 还 通过 仅 显 示 用 户 可 从 中 选择 值 的 适当 术语 列表 来 
提供 更 高 的 准确 性 。 由 于 企业 关键 字 也 是 一 类 托管 元 数据 ， 因 此 甚至 用 户 对 项 
应 用 的 企业 关键 字 也 会 更 加 一 致 ， 用 户 更 能 确信 其 准确 性 。 在 使 用 元 数据 自动 
化 业务 流程 时 〈 例 如 ， 根 据 其 部 门 属性 的 值 将 各 个 文件 中 的 文档 置 于 记录 中 
心 ) ， 可 以 确保 元 数据 由 授权 用 户 创建 ， 并 且 部 门 属性 的 值 始 终 为 一 个 有 
效 值 。 

2. 更 好 的 搜索 结果 

如 果 项 具有 一 致 的 属性 ， 则 简单 搜索 可 提供 关联 性 更 高 的 结果 。 

当 用 户 对 项 应 用 托管 术语 和 企业 关键 字 时 ， 会 将 用 户 引导 到 已 使 用 的 术语 。 
在 某 些 情况 下 ， 用 户 甚至 可 能 无 法 输入 新 值 。 由 于 用 户 侧 重 于 特定 的 术语 集 ， 
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此 将 这 些 术 语 (而 非 同义词 ) 应 用 于 项 的 可 能 性 更 大 。 这 样 一 来 ， 搜 索 托 管 术 
语 或 企业 关键 字 可 能 会 检索 关联 性 更 高 的 结果 。 

3. 动态 同步 和 更 新 

在 SharePoint Server 2010 的 早期 版 本 中 ， 为 了 将 一 个 属性 的 值 限 定 为 一 组 值 
中 的 某 个 值 ， 用 户 将 创建 一 个 类 型 为 “choice” 的 列 ， 然 后 提供 一 个 有 效 值 列 
表 。 在 需要 向 一 组 选项 添加 一 个 新 值 时 ， 用 户 将 修改 使 用 了 同一 组 值 的 每 
个 列 。 

通过 使 用 SharePoint Server 2010 中 的 元 数据 ， 可 以 将 一 组 有 效 值 与 其 值 必须 
为 一 组 有 效 值 中 的 某 个 值 的 列 分 隔 开 。 在 需要 添加 新 值 时 ， 用 户 向 术语 集 添加 一 
个 术语 ， 映 射 到 该 术语 的 所 有 列 将 使 用 更 新 的 选项 集 。 
通过 使 用 术语 ， 可 使 用 户 业 务 发 生变 化 时 使 SharePoint Server 2010 项 与 业务 
保持 同步 。 例 如 ， 假 定 公司 的 新 产品 在 其 开发 的 早期 阶段 具有 一 个 代码 名 称 ， 并 
在 产品 上 市 前 为 其 指定 了 一 个 正式 名 称 。 在 “产品 ”术语 集中 包含 了 一 个 针对 
代码 名 称 的 术语 ， 用 户 已 通过 使 用 此 术语 标识 与 产品 相关 的 所 有 文档 。 当 产品 名 
发 生 更 改 时 ， 可 以 编辑 此 术语 ， 并 将 其 名 称 更 改 为 产品 的 正式 名 称 。 虽 然 此 术语 
仍 应 用 于 同一 个 项 ， 但 其 名 称 现 已 得 到 更 新 。 


9.7.4 元 数据 的 传输 与 存储 


SharePoint Server 2010 通过 使 用 内 容 管理 器 引 和 人 了 元 数据 传输 和 存储 。 借 助 
内 容 管理 器 ， 新 的 网 站 级 别 功能 使 管理 员 和 用 户 能 够 使 用 基于 元 数据 的 规则 ， 更 
轻松 地 对 内 容 进 行 分 类 、 传 输 和 存储 。 网 站 管理 员 激 活 内 容 管理 器 功能 并 配置 设 
置 和 规则 之 后 ， 用 户 不 是 将 文档 直接 上 传 到 库 或 文件 夹 ， 而 是 可 以 使 用 下 列 方法 
之 一 保存 和 传送 文档 ， 并 据 此 向 文档 应 用 规则 : 

1) 将 文档 上 传 到 放置 库 。 系 统 会 在 已 激活 内 容 管理 器 功能 的 每 个 网 站 中 创 
建 放置 库 。 

2) 在 Word、Excel 和 PowerPoint 客户 端 应 用 程序 中 使 用 “另存 为 ”。 

3) 在 其 他 SharePoint 网 站 中 使 用 “发 送 到 ”。 

4) 使 用 Web 服务 对 象 模型 。 

5) 使 用 电子 邮件 放置 区 域 ， 使 用 Exchange， 可 通过 电子 邮件 将 文档 发 送 到 
网 站 中 。 

6) 提交 到 记录 中 心 网 站 ， 作 为 文档 生命 周期 或 有 效 期 的 一 部 分 。 例 如 ， 作 
为 工作 流 或 保留 策略 的 一 部 分 。 上 传 文档 之 后 ， 内 容 管 理 带 可 基于 文档 的 元 数 
据 ， 将 文档 传送 至 指定 文件 夹 或 自动 创建 新 文件 夹 。 例 如 ， 可 创建 新 文件 夹 作 为 
目标 文件 夹 的 子 文件 夹 ， 因 为 传送 规则 的 目标 文件 夹 变 得 过 大 ; 针对 字段 中 的 每 
个 新 值 创建 文件 夹 。 如 果 分 类 包含 100 个 术语 ， 可 为 这 100 个 术语 中 的 每 一 个 分 
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别 自动 创建 文件 夹 ， 每 一 个 文件 夹 的 创建 时 间 为 内 容 管 理 器 首次 对 带 有 特定 标记 
的 文档 进行 评估 的 时 候 。 新 文件 夹 将 从 父 文件 夹 继承 设置 ， 然 后 新 文件 夹 也 可 以 
拥有 其 他 规则 ， 用 于 定义 诸如 权限 、 默 认 元 数据 、 保 留 策略 以 及 其 中 的 文档 将 会 
继承 的 工作 流 等 附加 参数 。 例 如 ， 通 过 将 文档 标记 为 “企业 事务 " ， 会 将 该 文档 
传送 到 某 个 文件 夹 ， 该 文件 夹 拥 有 的 权限 比 库 中 不 同文 件 夹 内 其 他 文档 权限 的 限 
制 性 更 强 。 这 样 ， 元 数据 就 可 以 有 效 地 将 权限 应 用 到 SharePoint 中 的 文档 。 若 将 
文档 标记 为 “会 计 "， 会 将 该 文档 传送 到 受 保留 策略 限制 的 文件 夹 ， 保 留 策略 用 
于 确保 文档 已 保存 。 通 过 将 文档 标记 为 “人 力 资源 " ， 会 将 该 文档 传送 到 应 用 了 
任意 数量 的 附加 元 数据 标记 的 文件 夹 。 这 样 可 减少 用 户 应 用 大 量 元 数据 标记 的 必 
要 性 ， 从 而 缩短 做 标记 所 花费 的 时 间 并 减少 可 能 出 现 的 错误 。 

通过 用 元 数据 标记 内 容 以 及 将 内 容 管理 器 设置 和 规则 结合 使 用 ， 可 以 有 效 地 
确定 、 传 送 和 存储 组 织 中 的 任何 文档 ， 并 向 文档 应 用 附加 内 容 参 数 。 























9.8 管理 信息 策略 管理 





信息 管理 策略 是 用 于 调控 特定 类 型 重要 内 容 的 可 用 性 和 行为 的 一 组 规则 。 策 
略 使 管理 员 能 够 控制 和 评 佑 谁 能 访问 信息 、 将 信息 保留 多 长 时 间 ， 以 及 人 员 遵 守 





策略 的 效果 如 何 。 最 常见 的 策略 创建 者 和 实施 者 是 合 规 部 主管 、 记 录 管理 员 、IT 
人 员 和 其 他 负责 风险 管理 的 人 员 。 

利用 SharePoint Server 2010， 用 户 可 以 使 用 能 够 按照 业务 流程 来 管理 内 容 的 
策略 。SharePoint Server 2010 包含 多 项 策略 功能 ， 用 户 可 以 根据 自己 的 需求 对 它 
们 进行 自 定义 。 此 外 ， 它 还 包含 一 个 可 扩展 性 框架 ,使 用 户 可 以 创建 、 自 定义 和 
部 署 自己 的 策略 和 策略 功能 。 

在 SharePoint Server 2010 中 ， 每 个 策略 都 是 一 个 或 多 个 策略 功能 的 指令 集 集 
合 ， 每 个 策略 功能 都 提供 一 种 特定 的 内 容 管理 功能 。 可 以 将 策略 分 配 到 内 容 类 型 
或 列表 。 图 9-6 所 示 为 各 种 策略 元 素 的 概念 关系 。 

在 逻辑 上 ， 每 个 策略 都 是 一 个 或 多 个 策略 功能 的 指令 集 集合 。“ 策 略 功能 ” 
是 为 SharePoint Server 2010 提供 茶 些 内 容 管理 功能 的 程序 集 。 例 如 ， 到 期 、 审 
核 、 文 档 标签 和 条 人 码 都 是 SharePoint Server 2010 中 包含 的 策略 功能 。 

每 个 策略 均 由 一 个 XML 文档 表示 。 对 于 要 包括 在 策略 中 的 每 个 策略 功能 ， 
在 策略 中 包括 一 个 称 为 策略 项 的 指令 集 。 策 略 项 是 策略 中 的 一 个 XML 节点 ， 它 
仅 包 含 一 个 策略 功能 的 设置 。 这 些 设 置 包括 所 有 策略 项 都 需要 的 信息 ， 例 如 ID 
和 策略 功能 的 名 称 。 它 还 可 能 包括 一 个 自 定义 数据 元 素 ， 只 有 策略 功能 才 必须 要 
能 够 分 析 它 。 

对 于 策略 中 的 每 个 策略 功能 ， 只 有 一 个 策略 项 。 可 以 在 多 个 策略 中 包括 相同 
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网 站 集 
策略 集 
1 对 多 _ 
策略 。 1 对 多 二 
策 咯 项 入 咯 功能 全 次 源 | 
策略 项 人 人 人 人 人 
' 这 二 资源 
策略 1 对 多 二 策略 功能 
， GS- 菜子 资源 
策略 项 es 策略 功能 | 
Wo 一 
策 咯 项 -~ 人 人 
= 策略 资源 ， 


图 9-6 策略 框架 组 件 技术 体系 结构 


的 策略 功能 ; 在 每 个 策略 中 ， 功 能 具有 一 个 关联 的 策略 项 。 

此 外 ， 策 略 功能 可 以 使 用 一 个 或 多 个 “策略 资源 ”。 策 略 资源 是 一 种 程序 
集 ， 它 提供 策略 功能 所 需 的 某 些 功能 ， 从 而 为 其 提供 帮助 。 例 如 ， 条 码 策略 功能 
使 用 生成 条 码 的 条 码 提供 程序 作为 策略 资源 。 同 样 ， 到 期 策略 功能 使 用 到 期 公式 
计算 器 作为 策略 资源 ， 以 确定 文档 的 实际 到 期 日 期 。 此 策略 功能 还 使 用 到 期 操作 
策略 资源 来 确定 在 项 目 到 达 其 到 期 日 期 时 要 执行 什么 操作 。 

策略 功能 可 以 使 用 多 个 策略 资源 ， 但 每 个 策略 资源 仅 可 由 一 个 策略 功能 
使 用 。 

每 个 网 站 集 都 有 一 个 策略 集合 ， 此 集合 可 包含 任意 数量 的 策略 。 每 个 策略 包 
含 任 意 数量 的 策略 项 ， 而 且 每 一 项 均 指 向 单个 策略 功能 并 为 其 封装 设置 信息 。 多 
个 策略 可 以 包含 一 个 指向 相同 策略 功能 的 策略 项 。 每 个 策略 功能 可 以 使 用 任意 数 
量 的 策略 资源 来 帮助 执行 其 操作 。 每 个 策略 功能 使 用 自己 的 策略 资源 集合 ; 策略 
资源 在 策略 功能 之 间 不 共享 。 

只 能 将 一 个 策略 指定 到 给 定 的 内 容 类 型 或 SharePoint 列表 。 但 是 ， 该 策略 可 
包含 任意 数量 的 策略 项 。 
































9.9 内 容 管理 器 的 设置 


9.9.1 设置 内 容 


网 站 管理 员 可 配置 内 容 管理 器 设置 ， 以 确定 如 何 传送 上 传 到 网 站 的 内 容 。 这 
些 设 置 适 用 于 使 用 内 容 管理 需 传 送 的 所 有 内 容 。 内 容 管理 需 包 括 以 下 设置 : 
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1) 将 用 户 重 定向 到 放置 库 : 如 果 启 用 此 设置 ， 则 可 以 指定 在 应 用 了 一 个 或 
多 个 内 容 管理 器 规则 的 网 站 中 上 传 内 容 时 ， 将 用 户 重 定向 到 放置 库 。 如 果 禁 用 此 
设置 ， 则 用 户 可 绕 过 内 容 管理 器 ， 将 文件 直接 上 传 到 库 或 文件 夹 中 。 仅 当 使 用 文 
档 库 页 面 或 使 用 客户 端 应 用 程序 上 传 文档 时 ， 此 设置 才 适 用 。 

2) 发 送 到 其 他 网 站 : 如 果 启 用 此 设置 ， 则 可 以 创建 规则 ， 以 便 将 当前 网 站 
中 上 传 的 内 容重 定向 到 同样 激活 了 内 容 管理 器 功能 的 其 他 网 站 。 

3) 文件 夹 分 区 : 如 果 启 用 此 设置 ， 则 会 在 文件 夹 中 包含 的 项 超过 指定 数目 
时 ,创建 子 文件 夹 。 

4) 重复 提交 : 此 选项 指定 如 果 所 上 传 文档 的 名 称 与 目标 库 中 已 存在 文档 的 
名 称 相 同 ， 是 使 用 SharePoint 版 本 控制 还 是 将 唯一 字符 追加 到 重复 文件 名 的 
末尾 。 

5) 规则 管理 器 : 此 设置 指定 可 创建 规则 、 响 应 和 管理 与 任何 规则 均 不 匹配 
的 上 传 内 容 的 用 户 或 组 。 

6) 提交 点 数 : 此 不 可 配置 的 设置 提供 Web 服务 和 URL 以 及 可 用 于 设置 其 
他 网 站 或 电子 邮件 ， 以 将 内 容 发 送 至 网 站 的 电子 邮件 地 址 。 在 管理 中 心 新 建 
“发 送 到 ”位 置 时 ， 这 指定 为 提交 到 “发 送 到 ”位 置 文件 的 目标 位 置 服务 URL。 


9.9.2 ”内容 管理 规则 


规则 管理 器 可 创建 规则 。 规 则 确定 是 否 应 将 该 规则 应 用 于 传人 文档 ， 然 后 执 
行规 则 中 指定 的 操作 。 规 则 选项 包括 以 下 内 容 : 

1) 规则 名 称 : 指定 规则 的 名 称 。 

2) 规则 状态 和 优先 级 : 将 此 规则 的 优先 级 指定 为 1 ~9〈 如 果 应 用 多 个 规 
则 ) ， 也 可 以 指定 此 规则 处 于 非 活 动 状 态 ， 而 不 会 将 此 规则 应 用 于 任何 传人 
内 容 。 

3) 提交 的 内 容 类 型 : 指定 内 容 类 型 组 ， 如 “文档 内 容 类 型 ”、“ 发 布 内 容 类 
型 ”等 。 基 于 内 容 类 型 组 ， 可 以 为 规则 另 选 一 个 内 容 类 型 。 如 果 企 业 中 的 内 容 
类 型 使 用 不 同 的 名 称 ， 则 可 以 指定 备用 名 称 。 

4) 条 件 : 为 要 处 理 的 规则 应 用 基于 附加 属性 的 筛选 器 。 

5) 目标 位 置 : 指定 与 规则 相 匹 配 的 内 容 的 放置 位 置 。 

6) 提交 点 数 : 满足 以 上 所 有 条 件 的 项 目 将 要 保存 的 位 置 。 如 果 在 内 容 管理 
顺 设 置 中 选中 了 “发 送 到 其 他 网 站 ”选项 ， 则 会 看 到 一 个 下 拉 框 ， 其 中 列 出 了 
可 将 文档 发 送 到 的 当前 网 站 以 外 的 其 他 位 置 。 


9.9.3 激活 内 容 管理 器 功能 
为 了 在 网 站 中 使 用 内 容 管理 器 ， 必 须 激 活 内 容 管理 器 功能 。 为 网 站 激活 该 功 
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能 后 , “内 容 管 理 器 设置 ”和 “内 容 管理 器 规则 ”将 显示 在 “网 站 设置 ”页 上 
的 “网 站 管理 ”下 。 

配置 好 了 内 容 管理 器 后 ， 当 用 户 在 网 站 中 上 传 了 文档 之 后 ， 系 统 会 自动 提示 
它 ， 内 容 管理 器 已 经 将 文档 自动 转移 到 新 的 地 方 ， 并 且 会 显示 出 文档 所 在 位 置 的 
URL 路 径 。 

有 了 内 容 管理 器 后 ， 用 户 在 上 传 文档 时 ， 就 不 需要 再 考虑 到 底 将 文档 上 传 到 
哪个 地 方才 会 合适 。 文 档 所 在 位 置 的 选择 ， 被 交 给 了 内 容 管理 器 ， 按 照管 理 员 所 
设置 的 规则 ， 对 文档 进行 自动 路 由 和 分 类 。 
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10.1 Alfresco 概述 


Alfresco 是 一 个 成 熟 的 商业 化 运作 的 开源 ECM 系统 ， 它 致力 于 使 用 开源 软件 
创建 一 个 稳定 的 企业 级 平台 。Alfresco 是 开源 企业 级 内 容 管理 系统 的 首选 之 一 ， 
Alfresco 的 开源 模式 使 得 它 能 够 使 用 最 好 的 开源 技术 并 且 能 得 到 开源 社区 的 支持 ， 
以 非常 低 的 成 本 更 快 地 获得 更 高 质量 的 软件 产品 。 它 同时 结合 了 开源 方式 的 创造 
性 和 企业 级 平台 的 稳定 性 的 特点 。 作 为 付费 内 容 管理 产品 的 一 种 替代 方案 ， 在 超 
过 40 亿美 元 的 ECM 市 场 上 成 为 重要 的 一 员 。 

Alfresco 由 John Newton (Documentum 创始 人 之 一 ) 、John Powell (Business 
Objects 前 任 C00) 创立 于 2005 年 ， 投 资 公司 包括 Accel Parmers 、Mayfield Fund 
和 SAP Ventures。 














10.1.1 Alfresco 多 视点 模型 


Alfresco 管理 着 企业 内 部 的 各 类 内 容 : 文档 、 图 像 、 照 片 、 网 页 、 记 录 、 
XML 或 其 他 非 结 构 化 和 半 结 构 化 的 文档 。 之 所 以 Alfresco 如 此 突出 的 原因 是 它 提 
供 的 服务 和 控制 能 更 好 地 管理 这 些 内 容 ， 例 如 元 数据 管理 、 版 本 控制 、 生 命 周期 
控制 、 工 作 流 ， 搜 索 、 内 容 关联 、 标 签 、 评 论 及 其 他 。 这 些 功能 使 使 用 者 在 海量 
的 企业 数据 中 找到 自己 需要 的 内 容 ， 并 保证 精确 性 ， 还 能 使 使 用 者 通过 互联 网 或 
其 他 可 用 的 渠道 ， 向 其 他 用 户 发 布 信息 。 

Alfresco 产品 将 涉及 的 用 户 角色 分 成 四 类 模型 ， 每 一 类 用 户 角色 将 关注 ECM 
中 的 不 同方 面 。 这 四 类 角色 模型 分 别 是 最 终 用 户 、 业 务 用 户 、 开 发 者 、IT 组 


A 
织 











1. 最 终 用 户 视角 

对 最 终 用 户 来 说 ，Alfresco 将 作为 基于 他 们 现 有 管理 内 容 的 工具 的 一 套 应 用 
或 扩展 。Alfresco 可 以 作为 共享 驱动 器 来 替换 没有 组 织 、 搜 索 或 控制 功能 的 网 络 
共享 驱动 器 。Alfresco 拥有 组 织 和 控制 信息 的 能 力 ， 并 能 为 搜索 和 浏览 内 容 提供 
门户 界面 ， 以 蔡 换 网 络 共 享 驱动 絮 。 通 过 模拟 SharePoint 通信 协议 ，Alfresco 可 
以 帮助 用 户 在 微软 Office 里 使 用 0ffice 工具 管理 Office 文档 ， 而 Office 工具 本 身 
是 为 SharePoint 所 设计 的 。 更 为 重要 的 是 ，Alfresco 提供 了 一 套现 成 的 应 用 于 浏 
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览 、 搜 索 、 管 理 和 协作 内 容 库 中 的 内 容 。 这 些 应 用 包括 文档 管理 、 网 页 内 容 管 
理 、 内 容 写 作 、 记 录 管 理 和 Email 集成 。 

2. 业务 视角 

从 业务 角度 来 说 ，Alfresco 是 被 设计 为 可 以 支持 多 种 在 关键 业务 所 要 人 处 理 和 
使 用 的 内 容 需 求 。 文 档 管 理工 具 ， 应 用 和 接口 支持 一 般 公 办 应 用 、 搜 索 和 发 
据 。 而 工作 流 管理 功能 支持 多 种 业务 流程 ， 包 括 个 案 管理 、 审 查 和 批准 。 而 在 
协同 工作 的 应 用 上 ， 可 以 在 新 建 和 修改 文档 时 支持 信息 和 知识 的 共享 。 对 于 可 
扩展 的 Web 内 容 管理 服务 来 说 ， 也 可 以 支持 从 企业 到 它 的 客户 之 间 的 内 容 的 
交付 和 部 署 。 记 录 管 理 也 提供 了 一 种 用 户 可 以 承受 的 获取 和 保存 档案 的 方法 ， 
这 套 方法 也 是 建立 在 政府 批准 的 标准 上 的 。 基 于 标准 的 平台 也 提供 了 一 种 访问 
的 途径 ， 可 以 访问 使 用 这 些 标准 所 创建 的 应 用 ， 例 如 出 版 物 、 图 像 和 电子 邮件 
的 管理 。 

3. 开发 者 视角 

对 于 开发 者 而 言 ，Alfresco 提供 了 一 个 功能 齐全 的 、 可 扩展 的 内 容 / 知 识 管理 
平台 ， 可 以 简化 以 内 容 为 中 心 的 应 用 的 开发 。 基 于 内 容 管 理 和 Internet 标准 ，Al- 
fresco 展示 了 内 容 管理 作为 一 种 服务 的 能 力 ， 这 种 服务 能 被 基于 REST 或 SOAP 
的 Web 服务 所 访问 ， 或 被 新 的 OASIS 内 容 管 理 互 操作 性 服务 (CMIS) 标准 的 
Web 服务 所 访问 ， 或 者 PHP 语言 所 访问 。 它 也 可 以 被 直接 纳入 基于 Java 的 应 用 ， 
作为 核心 Java 服务 。 此 外 ， 为 了 提高 开发 速度 ，Alfresco 提供 了 轻 量 级 的 脚本 语 
言 去 访问 这 些 服务 ， 并 提供 一 种 轻 量 级 的 开发 模式 。 这 些 服务 提供 的 模式 类 似 于 
那些 使 用 数据 库 、 信 息 库 或 用 户 接口 组 件 ， 但 它 已 经 可 以 应 付 以 内 容 为 中 心 的 应 
用 的 独特 挑战 (例如 全 文 检索 和 层次 内 容 结 构 )。 由 于 是 开源 的 ， 这 个 平台 是 透 
明 的 ， 开 发 者 可 以 深入 到 内 部 的 开发 库 。Alfresco 也 提供 了 一 个 应 用 的 框架 ， 它 
可 以 提供 端 对 端的 服务 ， 也 是 可 扩展 的 ， 即 可 以 通过 Smf、CMIS、Web 脚本 和 
核心 服务 ， 建 立 自己 的 应 用 逻辑 以 及 定制 化 的 用 户 接 口 。 

4. IT 组 织 视角 

对 于 IT 组 织 ，Alfresco 提供 了 一 个 低 成 本 的 蔡 代 来 自 IBM、EMC、Open 
Text、 甲 骨 文 和 微软 的 封闭 源 代码 的 专 有 系统 。Alfresco 能 与 几乎 任何 数据 库 、 
应 用 服务 器 、 操 作 系 统 和 系统 监控 基础 设施 协作 以 满足 企业 IT 管理 标准 。 因 为 
是 一 个 纯 Java 的 应 用 ，Alfresco 几乎 可 以 在 任何 硬件 上 运行 。 由 于 在 应 用 核心 中 
建立 了 多 实例 的 能 力 ， 这 使 得 开 机 构 能 按 需 提供 虚拟 的 实例 ， 从 而 最 大 化 地 利 
用 现 有 的 硬件 。Alfresco 系统 的 小 尺寸 也 意味 着 它 能 够 很 好 地 利用 现 有 的 如 
VMware 和 Xen 虚拟 化 平台 。Alfresco 能 配置 成 具有 内 部 宛 余 的 集群 系统 来 提升 高 
可 用 性 和 灾难 恢复 。 最 重要 的 是 ，Alfresco 的 开源 和 开放 标准 意味 着 用 户 不 会 被 
锁定 到 一 个 专 有 的 平台 。 
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10.1.2 Alfresco 软件 体系 结构 


Alfresco 系统 从 很 多 方面 来 说 与 ECM 系统 十 分 相似 。 如 图 10-1 所 示 ， 在 核 
心 部 分 是 一 个 内 容 库 ， 用 来 持久 化 内 容 、 元 数据 、 关 联 关系 及 全 文 索引 ， 该 内 容 
库 的 运行 由 一 个 服务 器 所 支持 。 内 容 库 是 用 于 存储 各 种 数据 资源 的 服务 ， 它 的 作 
用 是 把 实际 的 各 种 不 同 格式 的 数据 转化 成 数据 库 或 文件 系统 可 以 存储 的 数据 ， 是 
一 种 基于 数据 库 和 文件 系统 之 上 的 应 用 。 

Alfresco 内 容 库 提 供 了 一 系列 可 以 通过 不 同 接口 调用 的 数据 存储 服务 ， 如 内 
容 存储 、 查 询 、 版 本 控制 、 内 容 转 换 / 复 制 / 编 辑 等 ， 这 些 基础 的 服务 可 以 为 不 同 
的 应 用 系统 提供 支持 。Alfresco 内 容 库 的 设计 目标 是 为 了 能 够 针对 不 同 的 内 容 管 
理 方 案 提 供 可 以 重用 的 组 件 。Alfresco 提供 支持 多 种 编程 语言 和 协议 的 编程 接口 ， 
开发 人 员 可 以 基于 该 接口 开发 定制 化 的 应 用 和 解决 方案 。Alfresco 现成 的 应 用 程 
序 能 提供 标准 的 ECM 解决 方案 ， 例 如 文档 管理 、 记 录 管 理 和 Web 内 容 管理 。 














内 容 应 用 Web 应 用 





定制 应 用 





内 容 应 用 服务 


10-1 Alfresco 系统 体系 结构 


与 其 他 ECM 系统 相 比 ，Alfresco 是 较 新 的 产品 ， 因 此 它 更 容易 使 用 新 的 技术 
架构 。Alfresco 系统 完全 基于 Java， 可 在 任何 Java 企业 版 的 系统 上 使 用 。 它 的 核 
心 是 Spring 平台， 这 使 得 Alfresco 能 模块 化 版 本 控制 、 安 全 和 规则 等 功能 。Al- 
fresco 可 使 用 Web 脚本 简化 新 增 功能 以 及 接口 的 开发 。Web 脚本 既 能 用 于 数据 层 
服务 ， 也 能 用 于 展现 层 服务 。Alfresco 尽 可 能 保持 架构 的 轻 量 级 以 便 下 载 和 安装 ， 
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并 方便 地 利用 新 的 打包 和 部 署 选 项 ， 如 云 计 算 平 台 。 
10. 1.3 Alfresco 系统 组 成 


1.Alfresco 的 内 容 应 用 服务 器 和 内 容 库 

内 容 应 用 服务 器 是 Alfresco 系统 的 核心 ， 管 理 和 维护 着 内 容 库 。 内 容 库 类 
似 数 据 库 ， 但 它 维护 的 不 仅仅 是 结构 化 数据 。 内 容 的 二 进 制 流 保存 在 内 容 库 
中 ， 相 关 的 全 文 搜索 索引 由 Lucene 索引 维护 。 实 际 的 二 进 制 流 的 内 容 是 以 文 
件 形 式 由 内 容 库 管 理 ， 虽 然 这 些 文件 只 能 在 系统 内 部 使 用 ， 与 在 实际 使 用 中 打 
开 的 文件 并 不 一 样 。 内 容 库 还 维护 着 内 容 条 目 、 分 类 和 文件 夹 /文件 结构 间 的 
关联 关系 。 文 件 夹 /文件 的 结构 维护 在 数据 库 中 ， 与 内 部 文件 存储 结构 并 不 
对 应 。 

内 容 应 用 服务 器 主要 负责 管理 、 访 问 和 更 新 内 容 库 中 内 容 所 涉及 的 业务 逻 
辑 。 内 容 应 用 服务 器 允许 运行 Web 脚本 的 应 用 或 是 Java 扩展 应 用 。 所 有 Alfresco 
ECM 套件 的 应 用 程序 都 是 基于 内 容 应 用 服务 器 构建 并 运行 的 。 

2. Alfresco 应 用 程序 

Alfresco 应 用 程序 建立 在 内 容 应 用 服务 器 之 上 ， 并且 依 赖 内 容 应 用 服务 器 来 
持久 化 、 访 问 、 查 询 和 管理 内 容 。Alfresco 应 用 程序 能 提供 基本 的 功能 来 满足 大 
部 分 用 户 管理 内 容 的 需求 。 其 中 2 个 最 主要 的 应 用 为 Alfresco Share 和 Alfresco 
Explorer。 

Alfresco Explorer 是 由 Alfresco 系统 提供 的 最 初 的 应 用 程序 ， 用 来 管理 内 容 。 
Alfresco Explorer 可 以 浏览 内 容 库 、 设 定 规则 和 操作 ， 并 管理 内 容 和 对 应 的 元 数 
据 、 关 联 关 系 和 分 类 。Alfresco Explorer 使 用 的 是 Java Server Faces 并 被 集成 人 内 
容 应 用 服务 器 中 。 目 前 ， 因 为 Alfresco Share 的 出 现 ，Alfresco Explorer 将 被 逐步 
淘汰 。 但 是 ， 很 多 扩展 和 语言 包 都 是 为 Alfresco Explorer 所 开发 的 。 同 时 Al- 
fresco Explorer 有 着 广泛 的 功能 来 管理 内 容 库 ， 并 且 它 也 被 认为 是 一 个 系统 管 
理工 具 。 

Alfresco Share 是 新 一 代用 户 界 面 ， 完 全 使 用 Alfresco Web 脚本 技术 构建 ， 并 
可 被 用 于 扩展 应 用 程序 。Alfresco Share 提供 了 拥有 简单 用 户 界 面 的 内 容 管 理 功 
能 ， 它 向 用 户 提 供 了 各 种 工具 ， 包 括 搜索 和 浏览 内 容 库 的 工具 ， 内 容 缩 略图 和 相 
关 的 元 数据 ， 使 用 flash 预览 内 容 的 展现 以 及 一 套 协 作 工 具 ， 如 Wikis、 论 坛 和 博 
客 。Alfresco Share 也 是 Alfresco 记录 管理 的 基础 。Alfresco Share 被 组 织 成 一 系列 
的 站 点 用 于 协作 时 的 相聚 地 点 。 

最 重要 的 是 ，Alfresco Share 是 一 个 可 扩展 的 应 用 基础 ， 通 过 对 其 扩展 能 为 某 
些 垂 直行 业 或 专家 领域 创建 垂直 的 应 用 。 没 有 必要 为 了 向 最 终 用 户 提供 一 般 性 的 
内 容 控 制 功 能 而 去 重新 设计 Alfresco Share 的 内 容 管理 界面 。 
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3. Alfresco 的 Web 层 和 Surf 

Alfresco 提供 了 ECM 的 数据 服务 、 用 户 界 面 和 用 户 应 用 等 功能 。 用 户 界面 是 
由 使 用 Alfresco 的 Web 层 、Surf 的 应 用 程序 和 应 用 组 件 提供 的 ，Surf 最 初 作为 一 
种 快速 开发 内 容 应 用 程序 的 方法 ， 使 用 脚本 和 REST 架构 。Sunf 大 量 使 用 Web 脚 
本 来 构建 用 户 界面 组 件 和 访问 CAS 的 信息 。 在 2009 年 ，Alfresco 将 Swf 作为 一 
个 项 目 贡 献 给 了 Spring 社区 ， 其 中 Surf 和 其 他 Spring Web 层 组 件 集成 起 来 形成 
了 Spring MVC、Spring Webflow 和 Grails。 

4. Alfresco 的 编程 模型 

使 用 Alfresco 内 容 应 用 服务 器 来 创建 应 用 时 ， 可 选择 多 种 编程 模型 。 最 简单 
的 模型 是 针对 那些 非 编程 人 员 的 ， 就 是 使 用 现成 的 Alfresco Share 应 用 程序 的 组 
件 、 使 用 规则 以 及 操作 模型 。 可 通过 使 用 向 导 来 定义 规则 和 操作 ， 操 作 包括 转换 
内 容 、 移 动 内 容 或 执行 简单 的 Javascript 片段 。 知 识 库 例 程 应 用 程序 使 用 规则 和 
操作 对 进入 知识 库 的 内 容 进 行 基本 的 处 理 。 

对 于 不 需要 复杂 编程 的 更 高 级 的 内 容 处 理 方式 ， 可 以 使 用 Web 脚本 。 事 实 
上 ，Alfresco CMIS 实现 和 Louts Quickr 集成 都 是 通过 Web 脚本 创建 的 。 通 过 使 用 
Javascript 创建 这 些 数据 服务 ， 将 很 容易 地 在 Alfresco 系统 中 创建 新 的 服务 。 如 果 
想 为 Alfresco Share 应 用 创建 新 的 用 户 界面 或 扩展 ， 同 样 可 以 通过 一 种 Web 模板 
语言 ， 如 FreeMarker 来 使 用 Web 脚本 。 大 部 分 的 Alfresco Share 应 用 程序 都 是 通 
过 Web 脚本 创建 的 。 

如 果 需 要 使 用 Java 来 创建 应 用 或 扩展 Alfresco Share， 可 以 使 用 很 多 Java 工 
具 。 因 为 Share 是 使 用 Suxf 创建 的 ， 因 此 可 以 通过 使 用 Java 和 Web 脚本 的 组 合 
或 单独 使 用 Java 来 创建 自己 的 扩展 。 可 以 使 用 Java 的 Spring 平台 来 访问 甚至 是 
替换 Alfresco、 内 容 应 用 服务 器 或 Alfresco Share 中 的 所 有 部 分 。 

最 后 ，Alfresco 的 应 用 程序 还 能 移植 到 其 他 的 ECM 系统 中 ， 通 过 使 用 内 容 管 
理 互 操作 性 服务 〈 在 第 4 章 详 细 介绍 ) 就 可 以 实现 。 它 是 一 个 用 于 访问 内 容 库 
的 OASIS 标准 。 知 识 库 中 提供 了 使 用 一 些 CMIS 构建 可 移植 的 应 用 程序 的 例子 。 
































10.2 Alfresco 的 功能 体系 架构 


10.2.1 Alfresco 内 容 管理 服务 器 


作为 ECM 应 用 服务 器 ， 最 主要 的 任务 就 是 提供 一 套 完整 用 来 构建 ECM 的 解 
决 方案 。 从 某 种 意义 上 讲 ， 应 用 服务 器 相当 于 一 个 黑 盒 ， 用 来 存储 和 管理 服务 。 
如 同 关系 型 数据 库 一 样 ， 内 容 的 二 进 制 流 保存 在 内 容 库 中 ， 相 关 的 全 文 搜索 索引 
由 Lucene 的 索引 维护 。 实 际 二 进 制 流 的 内 容 是 以 文件 形式 由 内 容 库 管 理 ， 虽 然 
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这 些 文件 只 能 在 系统 内 部 使 用 ， 与 通常 在 实际 使 用 中 打开 的 文件 并 不 一 样 。 内 容 
库 还 维护 着 内 容 条 目 、 分 类 和 文件 夹 /文件 结构 间 的 关联 关系 。 文 件 夹 /文件 的 结 
构 维护 在 数据 库 中 ， 与 内 部 文件 存储 结构 并 不 对 应 。Alfresco 应 用 服务 器 提供 一 
套 远 程 公共 接口 ， 供 客户 端 调用 和 交互 ， 如 图 10-2 所 示 。 


Alfresco 内 容 应 用 服务 | ”| 
Web 脚 本 框架 Web 服 务 框架 


扩展 内 容 服 务 




















控制 服务 
协作 服务 





图 10-2 Alfresco 内 容 管理 服务 器 服务 模式 


内 容 应 用 服务 器 主要 负责 管理 、 访 问 和 更 新 内 容 库 中 的 内 容 所 涉及 的 业务 逻 
辑 。 内 容 应 用 服务 器 允许 运行 Web 脚本 的 应 用 或 是 Java 扩展 应 用 。 所 有 Alfresco 
ECM 套件 的 应 用 程序 都 是 基于 内 容 应 用 服务 器 构建 以 及 运行 的 。 

对 于 应 用 服务 器 来 说 ， 远 程 公 共 接 口 是 客 户 端 唯一 可 见 的 部 分 。Alfresco 提 
供 了 两 种 应 用 程序 接口 ， 远 程 应 用 接口 允许 编写 程序 来 访问 服务 ， 而 协议 绑 定 则 
使 用 兼容 协议 的 客户 端 来 映射 服务 器 的 服务 。 

应 用 服务 器 的 内 部 被 划分 为 多 个 层次 ， 而 位 于 底层 的 基础 架构 包括 配置 、 认 
证 、 权 限 和 事务 管理 ， 它 们 将 会 横 跨 所 有 的 上 层 功能 。 

这 些 底层 的 基础 架构 被 封 财 在 应 用 服务 器 内 部 ， 提 供 了 路 平台 的 实现 ， 例 如 
事务 管理 功能 和 缓存 机 制 。 

Alfresco 内 容 仓 库 在 标准 的 基础 上 ， 实 现 了 以 上 的 基础 架构 ， 形 成 了 内 容 、 
管理 、 协 作 等 服务 的 基本 组 件 。 每 个 内 容 仓库 或 内 容 服务 的 功能 被 单独 设计 为 有 
一 个 独立 进程 的 接口 和 实现 模块 ， 模 块 间 通过 接口 的 基础 架构 进行 联系 。 

可 以 使 用 内 容 仓库 和 内 容 服务 提供 的 服务 接口 实现 应 用 服务 器 的 扩展 程序 ， 
将 其 部 署 到 Alfresco 的 应 用 服务 器 上 延伸 或 覆盖 它 原 有 的 功能 。 





























10.2.2 Alfresco 内 容 仓库 


CMIS 和 JCR 两 大 标准 定义 了 内 容 仓库 必须 提供 的 基本 服务 ( 见 图 10-3 ) ， 
这 些 服务 包括 : 定义 内 容 结构 ， 即 建 模 ; 创建 、 修 改 、 删 除 内 容 与 原 数据 之 间 协 
作 、 内 容 之 间 协 作 ; 查询 内 容 ; 内 容 访问 控制 (权限 管理 ) ; 内 容 版 本 控制 ;内 
容 展 示 ; 锁 机 制 ; 事件 管理 ; 内 容 审 计 ; 导入 /导出 ; 支持 多 国语 言 ; 规则 / 
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查询 
Tr 
审计 规则 /动作 导入 /导出 


存储 
存 他 引 
健 / 什 存储 三 进 制 内 容 存储 案 引 存储 


架构 


i 


图 10-3” ”Alfresco 内 容 仓 库 








执行 。 

Alfresco 内 容 仓库 提供 了 对 以 上 所 有 服务 的 全 面 实现 ， 可 以 通过 Alfresco 提 
供 的 应 用 程序 接口 ，CMIS 协议 绑 定 和 JSR-170 Java API 来 引用 这 些 服 务 。 

Alfresco 内 容 仓库 的 核心 是 一 个 存储 引擎 ， 负 责 存储 和 检索 内 容 、 元 数据 及 
内 容 间 的 相互 关系 ， 存 储 引 警 在 以 下 结构 中 运行 : 

1) 节点 : 提供 内 容 的 元 数据 和 结构 。 一 个 节点 可 以 支持 多 个 属性 值 与 其 他 
节点 (如 文件 夹 和 注释 ) 间 的 联系 。 父 节点 和 子 节点 间 的 关系 则 使 用 了 特殊 的 
处 理 方 式 。 

2) 内 容 : 记录 的 内 容 本 身 ， 例 如 Word 文档 或 一 个 XML 片断 。 

3) 定义 在 内 容 仓库 里 的 内 容 模型 ， 包 括 了 节点 的 结构 、 相 互 关 系 ， 以 及 属 
性 值 的 限制 。 

存储 引擎 使 用 了 一 个 基于 Apache Lucene 的 自 定义 查询 引擎 ， 支 持 以 下 查询 
功能 : 源 数据 过 滤 、 路 径 匹配 、 全 文 查询 及 以 上 功能 的 综合 查询 。 
查询 引 敬 和 存储 引擎 与 事务 管理 和 权限 管理 等 基础 服务 联系 起 来 ， 可 以 提供 
一 致 性 的 视图 和 权限 访问 。 查 询 方式 支持 原生 的 Lucene 查询 、XPath 查询 、Al- 
fresco 全 文 查询 ， 以 及 CMIS 查询 语言 ， 如 图 10-4 所 示 。 

默认 情况 下 ，Alfresco 将 节点 存储 在 关系 型 数据 库 中 ， 同 时 将 内 容 存储 在 文 
件 系统 里 。 使 用 数据 库 可 以 直接 利用 数据 库 本 身 的 技术 来 快速 提高 事务 支持 、 缩 
放 和 管理 等 功能 。Alfresco 使 用 了 一 个 数据 库 抽 象 层 与 数据 库 进 行 交 互 ， 从 而 使 
存储 引擎 可 以 从 复杂 的 SQL 连接 语句 中 独立 出 来 ， 简 化 了 数据 库 移植 工作 ， 使 
得 Alfresco 可 以 轻松 应 用 于 各 种 主流 数据 库 实现 。 

内 容 管理 服务 则 完全 是 建 在 存储 和 查询 引擎 之 上 的 。 通 过 这 些 引擎 基础 服务 
可 以 达到 共享 。 用 户 和 组 的 概念 被 引入 到 这 些 基础 服务 中 ， 比 如 记录 内 容 的 作 
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者 、 


这 些 根据 标准 定义 的 服务 实现 已 经 全 部 在 
Alfresco 内 容 仓库 中 被 模块 化 。 


10. 


仓库 ， 它 还 包括 一 组 高 附加 值 的 扩展 内 容 
服务 ， 如 图 10-5 所 示 。 


内 容 
过 程 的 封装 ; 协作 一 将 内 容 与 社会 网 络 


谁 锁定 了 内 容 、 谁 有 权限 访问 内 容 等 。 










查询 引擎 


本 地 Lucene 
2.3 Alfresco 内 容 服务 
Alfresco 应 用 服务 器 不 仅 是 一 个 内 容 的 








下 璐 洛 同 


CMIS QL 


Alfresco FTS 


扩展 内 容 服务 内 容 主 要 分 为 以 下 几 类 : 
高 级 内 容 管理 功能 ;控制 一 一 对 








图 10-4 Alfresco 查询 引擎 





集成 。 











内 容 仓库 提供 了 一 套 水 平 的 管理 服务 功能 ， 这 些 服 务 的 目的 是 提供 一 些 类 似 


于 积木 式 的 基础 模块 ， 来 满足 各 种 不 同 的 内 容 管理 需求 ， 包 括 文档 管理 、 网 站 内 
容 管理 、 记 录 管 理 等 。 这 些 服务 都 建立 在 内 容 仓库 之 上 ， 使 用 模块 化 组 件 的 形 


式 ， 


不 失 


同时 共享 同样 的 基础 架构 。 


服务 


格式 转换 元 数据 提取 





图 10-5 Alfresco 扩展 的 内 容 服 务 


很 显然 ，Alfresco 可 以 提供 一 套 统 一 的 综合 性 内 容 管理 服务 ， 但 Alfresco 并 

















E 存 这 人 么 做 。 通 常情 况 下 ，ECM 系统 架构 的 成 长 是 通过 收购 和 合并 其 他 一 些 








独立 的 系统 ， 甚 至 这 些 系统 有 它们 自己 的 内 容 仓 库 ，Alfresco 却 反 其 道 而 行 之 ， 
通过 使 用 一 组 独立 的 服务 搭配 来 达到 系统 架构 的 扩展 。 


尽管 表面 上 看 来 内 容 管理 是 一 个 分 散 的 概念 ， 但 事实 上 ， 一 个 完整 的 需求 和 


ECM 解决 方案 通常 正 是 这 些 分 散 概 念 的 集合 。 


总 体 上 来 看 ， 高 级 内 容 服务 包括 以 下 几 点 : 

1) 生命 周期 一 一 管理 内 容 的 不 同 阶段 。 

2) 格式 转换 一 一 将 内 容 从 一 种 格式 转换 到 男 一 种 格式 。 
3) 元 数据 提取 一 一 同步 文档 和 节点 的 元 数据 。 

4) 标签 一 一 对 用 户 随 机 生成 的 标签 进行 正式 的 分 类 。 
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内 容 管理 服务 封 半 了 内 容 运行 的 流程 ， 包 括 以 下 几 个 方面 : 

1) 工作 流 一 一 将 一 组 连续 的 步骤 组 织 到 一 起 ， 通 常会 包括 在 不 同 员工 间 分 
配 工作 。 

2) 记录 一 一 文件 计划 ， 记 录 类 型 ,保留 和 存档 的 政策 ,分配 ， 报 告 ， 达 到 
DOD 5015. 2 标准 认证 。 

3) 变更 集 一 一 安全 修改 内 容 的 工作 区 。 

4) 预览 一 一 在 发 布 内 容 之 前 查看 内 容 。 

5) 部 署 一 一 将 内 容 从 一 个 环境 发 布 到 另 一 个 环境 。 

6) 协作 服务 一 一 将 产品 和 发 布 内 容 整 合 到 了 社会 网 络 中 。 

7) 社交 图 一 一 直接 或 间接 地 以 小 组 或 团队 的 方式 展示 人 际 间 的 关系 。 

8) 活动 一 一 使 用 Alfresco 或 其 他 协作 工作 ， 进 行 持续 的 人 际 间 交互 活动 。 

9) 维基 一 一 一 种 基于 网 络 ， 易 于 创建 和 修改 的 页 面 。 

10) 博客 种 日 志 ， 用 来 定期 维护 评论 、 事 件 和 包括 文档 、 视 频 在 内 
的 其 他 材料 。 

11) 论坛 一 一 有 特定 主题 的 交流 谈话 。 

Alfresco 一 直 持 续 在 新 的 版 本 中 增加 服务 ， 当 然 ， 这 种 开 箱 即 用 的 服务 不 可 
能 完全 满足 所 有 的 需求 ， 所 以 根据 模块 化 的 设计 以 及 应 用 服务 器 提供 的 开放 的 编 
程 接口 ， 最 终 总 是 可 以 定制 出 适合 自己 的 服务 。 


10.2.4 Alfresco 支持 的 协议 


为 了 易于 外 部 协作 ， 简 化 使 用 ，Alfresco 支持 多 数 基于 文档 管理 的 协议 。 这 
样 就 可 以 使 用 原 有 的 客户 端 进行 工作 ， 以 熟悉 的 方式 来 访问 存储 在 内 容 仓库 里 的 
内 容 。 事 实 上 ， 很 多 使 用 者 并 不 知道 他 们 正在 使 用 Alfresco， 而 他 们 创建 或 使 用 
的 内 容 却 都 是 通过 Alfresco 进行 流程 管理 的 。 

所 有 的 绑 定 协议 将 会 暴露 存储 在 Alfresco 内 容 仓 库 的 文档 及 结构 ， 如 图 10-6 
所 示 ， 这 意味 着 客户 端 软件 使 用 这 些 协议 来 访问 内 容 仓库 时 可 以 进行 导航 、 检 查 
属性 、 查 看 内 容 等 操作 。 大 多 数 协议 还 支持 权限 更 新 ， 人 允许 客 户 端 工 具 修 改 文件 
夹 结构 ， 创 建 和 更 新 内 容 ， 编 写 内 容 。 某 些 协议 更 是 强大 到 支持 版 本 控制 、 查 询 
任务 等 功能 。 

从 Alfresco 内 部 看 来 ， 绑 定 协 议 可 以 与 封闭 了 文档 及 结构 的 内 容 仓 库 服 务 进 
行 交 互 ， 保 证 了 所 有 客户 一 致 性 的 视图 ， 统 一 了 所 有 客户 端 工具 与 Alfresco 内 容 
应 用 服务 器 的 交互 方法 。Alfresco 的 文件 服务 器 子 系统 通过 属性 配置 文件 或 JMX 
为 所 有 协议 提供 了 配置 管理 和 生命 周期 管理 。 

以 下 是 Alfresco 支持 的 协议 类 型 . 

1) CIFS (公共 互联 网 文件 系统 ) 是 一 种 将 Alfresco 映射 成 一 个 本 地 共享 磁 
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微软 SharePoint 


图 10-6 Alfresco 内 容 仓库 的 文档 及 结构 


盘 驱 动 的 协议 。 任 何 可 以 读 写 磁盘 驱动 需 内 文件 的 客户 端 工具 都 可 以 对 Alfresco 
进行 读 写 ， 用 户 在 不 需要 了 解 Alfresco 的 情况 下 即 可 使 用 共享 文件 夹 。 

2) WebDAV (基于 网 络 的 分 布 式 创作 和 版 本 控制 ) 是 对 HTTP 的 一 组 扩展 ， 
允许 用 户 在 网 络 服务 器 上 合作 管理 文档 。 它 强化 了 创作 文件 的 功能 包括 锁 机 制 、 
原 数 据 、 版 本 控制 。 包 括 微软 Office， 越 来 越 多 的 内 容 创 建 工具 都 在 支持 Web- 
DAV ， 同 时 已 经 有 很 多 工具 支持 将 WebDAV 服务 器 挂 载 成 一 个 网 络 磁盘 。 

3) FTP (文件 传输 协议 ) 是 一 个 标准 的 网 络 协 议 ， 支持 通过 网 络 进行 文件 
交换 和 执行 。 该 协议 尤其 适合 在 Alfresco 内 容 仓 库 中 进行 大 批量 文档 导入 导出 
工作 。 

4) IMAP (互联 网 消息 访问 协议 ) 是 一 个 流行 的 允许 远程 访问 邮件 服务 器 
上 电子 邮件 的 协议 。Alfresco 可 以 作为 一 个 邮件 服务 右 ， 人 允许 Microsoft Outlook 、 
AppleMail 和 Thunderbird 直接 连接 和 访问 Alfresco 内 容 仓库 里 的 文档 内 容 。 协 议 
提供 三 种 模式 : 

QD 归档 : 允许 使 用 简单 的 拖 搜 、 复 制 剪 切 的 方式 从 IMAP 客户 端 上 直接 将 
电子 邮件 存储 到 Alfresco 内 容 仓 库 。 

Q 虚拟 化 : IMAP 客户 端 可 以 以 电子 邮件 的 方式 导出 Alfresco 内 容 仓 库 里 的 
内 容 ， 可 以 查看 内 容 的 原 数 据 ， 点 击 电子 邮件 上 的 链接 来 触发 某 些 动作 。 

@) 集成 : 以 上 两 种 方式 的 集合 。 

微软 SharePoint 协议 支持 将 Alfresco 设置 为 Sharepoint 服务 器 ， 与 微软 Office 
套件 进行 紧密 协作 ,使 得 那些 熟悉 使 用 微软 任务 管理 的 用 户 可 以 快速 查看 和 使 用 
Alfresco 内 容 仓 库 中 的 文档 ,使 用 微软 SharePoint 的 合作 服务 。 


10.2.5 Alfresco 应 用 编程 接口 
Alfresco 内 容 应 用 服务 器 根据 不 同类 型 的 客户 开放 出 两 种 类 型 的 应 用 编程 接 


服 
务 
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口 :远程 应 用 编程 接口 ， 即 客户 端 使 用 远程 通信 协议 来 访问 Alfresco 内 容 应 用 服 
务 器 ， 具 体 来 说 就 是 将 它 视 为 一 个 黑 盒 ; 仍 入 式 应 用 编程 接口 ， 使 用 在 Alfresco 
应 用 服务 带 骨 部 注册 的 $ 展 来 访问 Alfresco 内 容 应 用 服务 器 。 
远程 应 用 编程 接口 

Alfresco 内 容 应 用 服务 器 主要 使 用 远程 应 用 编程 接口 来 创建 企业 内 容 管理 解 
决 方案 。 事 实 上 ，Alfresco 开放 了 两 种 类 型 的 远程 接口 : DWeb 服务 ， 基 于 
SOAP 的 面向 服务 型 接口 ，@RESTful， 基 于 HTTP 的 面向 资源 型 接口 。 

Alfresco 率先 在 其 产品 1.0 版 本 中 推出 了 Web 服务 API， 它 涵盖 了 Alfresco 
内 容 应 用 服务 器 的 许多 核心 服务 。 然 而 ， 基 于 SOAP 接口 的 需求 已 经 逐步 减弱 ， 
Alfresco 也 在 降低 对 其 关注 度 。 而 基于 Web 服务 的 编程 接口 ， 它 的 优点 是 能 找到 
大 量 用 来 构建 客户 端 绪 定 的 工具 ， 这 些 工 具 涵盖 了 和 常见 的 环境 和 所 有 的 编程 语 
言 ， 可 以 使 用 包括 Java、 微 软 的 . NET、PHP 和 Alfresco 的 Flex 等 不 同 语言 ， 通 
过 这 些 接口 ， 从 任何 地 方 远程 访问 Alfresco 内 容 应 用 服务 器 ， 如 图 10-7 所 示 。 
同时 为 了 保证 兼容 性 ，Alfresco 使 用 集成 的 Apache CXF 引擎 进行 了 彻底 、 全 面 的 
整合 测试 。 网 络 服务 API 也 同样 适用 于 业务 流程 管理 ， 通 过 引入 第 三 方 的 业务 流 
程 管理 引擎 ， 可 以 将 更 加 广泛 的 业务 流程 管理 整合 进 内 容 管理 服务 体系 。 

















Alfresco 客 户 端 


| | 


SOAP | RESTful 


CMIS Alfresco 
WS REST 
Alfresco 内 容 应 用 服务 


图 10-7 Alfresco 支持 的 远程 接口 


Alfresco 在 它 的 2.1 版 本 中 引入 了 RESTful API， 并 在 此 后 迅速 将 其 扩展 到 所 
有 的 应 用 服务 器 服务 中 去 。 开 发 人 员 青 睐 它 ， 因 为 其 与 网 络 本 身 工作 方式 更 易于 
整合 。 在 任何 环境 下 ， 用 任何 编程 语言 ， 都 可 以 扩展 HTTP 客户 端 与 Alfresco 交 
此 外 ， 男 一 个 亮点 是 ， 简化 了 面向 AJAX 网 络 客户 端的 使 用 。 基 于 Spring 
Surf 的 Alfresco Share 即 通 过 它 来 远程 访问 Alfresco 应 用 服务 器 。 除 此 之 外 ，Al- 
fresco 还 集成 了 Spring Web 脚本 用 来 开发 RESTful API。 
Alfresco 提供 的 Web 服务 和 RESTful API 尽管 是 基于 公用 接口 ， 但 却 专 属 Al- 
fresco 应 用 。 这 意味 着 基于 这 两 种 接口 开发 的 客户 端 应 用 程序 只 能 适用 于 Alfres- 
这 将 会 限制 使 用 存储 在 其 他 类 型 内 容 仓 库 里 的 内 容 。 这 个 问题 困扰 了 企业 内 
容 管理 领域 很 多 年 ， 这 也 是 引入 CMIS 的 原因 。 
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CMIS 提供 了 针对 内 容 仓库 的 一 组 标准 服务 ，CMIS 并 不 针对 编程 语言 ， 它 并 
没有 规定 内 容 仓库 是 如 何 工 作 的 ， 它 也 并 不 期 望 共用 内 容 仓库 的 所 有 功能 。 事 实 
上 ， 它 的 目标 是 定义 一 组 内 容 仓库 的 标准 服务 ， 同 时 基于 Web 服务 和 RESTful。 

CMIS 的 重要 性 体现 在 它 提 供 了 开发 者 合作 的 重点 应 该 关注 于 工具 的 成 长 、 
功能 ， 以 及 企业 内 容 管理 的 解决 方案 ， 而 避免 被 绑 定 在 某 个 特定 的 内 容 仓库 上 。 

2. 由 入 式 编程 接口 

般 入 式 编程 接口 被 用 来 开发 Alfresco 内 容 应 用 服务 器 的 扩展 。 这 些 扩 展 基于 
已 有 的 服务 器 服务 开发 ， 将 被 部 署 到 服务 器 。 因 此 可 以 这 么 说 ， 通 过 般 入 式 编程 
接口 ， 可 以 深入 服务 器 提供 的 服务 本 身 来 开始 其 扩展 应 用 。 

如 图 10-8 所 示 ， 舱 入 式 编程 接口 有 多 种 类 型 ， 用 来 处 理 不 同 结构 或 类 型 的 
扩展 : 














Alfresco 内 容 应 用 服务 


Alfresco Java 基 础 API 


| ”JCRQava 内 容 仓库 ) | 


J | aaseriptar | API 


| FreeMarkerAapL | | FreeMarkerAapL | 


RE | 








图 10-8 Alfresco 般 入 式 编程 接口 





1) Alfresco Java 基础 编程 接口 : 由 Alfresco 应 用 服务 器 提供 的 服务 开放 出 来 
的 一 组 公共 Java 接口 。 

2) JCR: 对 内 容 仓库 进行 交互 的 标准 接口 集 (JSR-170 ) 。 

3) JavaScript API: 一 个 面 癌 对 象 的 视图 ， 被 Java 基础 编程 接口 裁剪 后 
于 JavaScript 应 用 。 

4) FreeMarker API: 一 个 面向 对 象 的 视图 ， 被 Java 基础 编程 接口 裁剪 后 适 
用 于 FreeMarker 应 用 。 

5) 内 容 定 义 : 创建 和 编辑 内 容 模 型 的 编程 接口 。 
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6) 工作 流 定义 : 定义 业务 流程 的 编程 接口 。 

可 以 开发 出 下 列 类 型 的 服务 扩展 ， 有 一 些 需要 Java 知识 ， 还 有 一 些 需要 脚 
本 的 知识 : 

1) Web 脚本 : 定义 和 实现 一 个 RESTful API。 

2) 转换 : 将 内 容 从 一 种 类 型 转换 成 男 一 种 类 型 。 

3) 政策 : 对 一 个 事件 处 理事 件 注册 。 

4) 服务 : 封闭 一 系列 相关 的 功能 。 

5) 内 容 模型 : 定义 类 型 、 方 面 和 相互 间 关 系 。 

6) 流程 : 一 个 业务 流程 。 

Web 脚本 是 一 个 很 有 用 的 扩展 ， 它 允许 开发 出 自 定 义 的 RESTful API， 这 意 
味 着 用 户 可 以 定义 出 自己 的 远程 接口 来 供 客户 端 访问 Alfresco 内 容 应 用 服务 器 。 
一 个 Web 脚本 会 根据 它 的 实现 使 用 多 种 能 入 式 接 口 ， 例 如 Java 基础 编程 接口 : 
JCR、JavaScript 和 FreeMarker。 开 发 自 定 义 的 远程 接口 下 列 应 用 情况 : 

1) 定义 部 署 在 Alfresco 应 用 服务 器 新 的 扩展 服务 ， 开 放出 接口 给 远程 客 
户 端 。 

2) 开发 出 一 个 门户 用 来 集成 第 三 方 工具 ， 如 表单 引擎 。 

事实 上 ， 当 设计 出 Web 脚本 框架 后 ， 解 决 方案 希望 通过 使 用 相似 的 脚本 和 
MVC 方式 来 简化 脚本 开发 ， 它 成 为 了 一 个 流行 的 Alfresco 扩展 开发 方式 。 男 一 个 
敬 入 式 接口 的 用 例 是 ,一 个 应 用 或 客户 端 程序 可 以 通过 继承 内 容 服 务 组 件 直 接 凯 
入 到 Alfresco 内 容 管理 服务 器 中 。 如 前 文 所 述 ， 服 务 器 的 基础 架构 意味 着 它 可 以 
被 部 署 到 不 同 的 环境 中 ， 而 不 仅仅 是 作为 Web 应 用 。 本 质 上 ，Alfresco 内 容 应 用 
服务 需 被 视 为 一 个 库房 ， 在 其 中 的 服务 ， 包 括 内 容 仓库 可 以 被 独立 或 组 合 使 用 ， 
提供 定制 化 的 解决 方案 。 服 务 需 完全 可 以 根据 需求 缩小 或 扩大 。 


10.2.6 Alfresco 内 容 模 型 


Alfresco 内 容 仓库 提供 了 一 个 极其 简易 的 方式 来 展示 内 容 和 相互 间 的 关系 ， 
通过 定义 少量 的 可 复 用 数据 结构 ， 来 构建 复杂 的 内 容 模型 。 同 时 它 还 支持 在 不 同 
的 读 写 性 能 需求 情况 下 ， 在 不 同类 型 的 物理 存储 引擎 里 建立 内 容 仓库 。 

内 容 建 模 的 核心 是 支持 分 层 的 节点 。 节 点 代表 着 任何 需要 存储 在 仓库 里 的 内 
容 。 每 个 节点 有 唯一 标识 符 ， 同 时 可 以 包含 任意 多 的 属性 值 ， 属 性 值 可 以 是 任何 
数据 类 型 ， 可 以 为 单个 值 或 多 个 值 。 节 点 间 通 过 关系 结构 组 织 在 一 起 。 父 子 关系 
是 其 中 的 一 种 特殊 类 型 ， 它 的 子 节 点 将 依附 于 父 节 点 ， 不 能 脱离 父 节 点 而 单独 存 
在 。 可 以 自己 创建 节点 间 的 其 他 关系 ， 定 义 不 同 类 型 节点 的 关系 。 

从 导 辑 上 看 ， 内 容 仓库 被 划分 成 多 个 存储 空间 ， 每 个 存储 空间 包括 自己 的 节 
点 结构 。 节 点 可 以 代表 任意 形式 的 内 容 ， 但 在 企业 内 容 管理 领域 里 ， 它 一 般 被 视 
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为 文件 夹 、 文 档 、XML 片段 、 展 示 类 型 、 合 作 站 点 和 用 户 ( 见 图 10-9)。 

Alfresco 内 容 仓库 提供 了 读 、 查 询 和 维护 节点 等 服务 。 事 件 由 变更 产生 ， 从 
而 触发 流程 。 特 别 地 ， 内 容 存 储 库 提供 以 下 基于 事件 的 功能 : 

政策 : 事件 处 理 器 可 以 注册 到 所 有 节点 或 特定 类 型 节点 上 ， 用 来 处 理 某 种 类 
型 的 事件 。 

规则 : 基于 增加 、 更 新 或 删除 节点 的 步 又， 声明 定义 相应 的 流程 〈 例 如 电 
子 邮 件 规则 ) 。 

内 容 模型 定义 了 内 容 库 节 点 的 限制 条 件 。 每 个 内 容 模型 定义 了 一 个 或 多 个 类 
型 ， 而 每 个 类 型 枚 举 了 对 应 的 节点 必须 支持 的 属性 和 关系 。 如 图 10-10 所 示 ， 经 
常会 要 求 模 型 的 定义 支持 跨 多 类 型 的 节点 ，Alfresco 通过 面向 方面 的 方法 来 解决 
了 这 个 问题 ， 尽 管 一 个 节点 只 能 是 某 一 种 类 型 ， 但 它 可 以 同时 应 用 多 个 方面 ， 从 
而 为 内 容 建 模 提 供 了 更 有 弹性 的 方式 。 









































图 10-9 分 层 节点 类 型 模型 图 10-10 节点 内 容 属 性 和 关系 模型 





模型 同时 还 定义 了 各 种 关系 、 属 性 数据 类 型 和 值 约束 。 内 容 就 是 数据 类 型 的 
一 个 特殊 实现 ， 它 允许 属性 值 为 任意 长 度 的 二 进 制 数据 。 在 企业 内 容 管理 里 ， 许 
多 模型 已 经 成 为 内 容 管 理 的 标准 ，Alfresco 内 容 应 用 服务 器 提供 了 大 量 预定 义 的 
模型 ， 包 括 内 容 / 文 档 层次 、 都 柏林 核心 、 维 基 、 博 客 、 讨 论 、 合 作 站 点 、 
DOD 5015. 2 。 

这 些 模型 表现 在 内 容 的 元 模型 里 , 如 图 10-11 所 示 ， 与 CMIS 域 模 型 和 JCR 
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图 10-11 节点 元 模型 


节点 类 型 模型 有 机 地 结合 在 一 起 。 





同时 还 可 以 根据 不 同 的 用 例 定义 新 的 模型 ， 无 论 是 重新 建立 还 是 继承 现 有 的 
模型 。 


10.2.7 Alfresco 应 用 部 署 


Alfresco 模块 化 的 设计 以 及 基于 基础 架构 的 平台 服务 ， 提 供给 Alfresco 多 种 
部 署 方式 和 拓扑 结构 。 更 为 灵活 的 是 ，Alfresco 的 基础 架构 将 Alfresco 从 它 执行 
的 环境 中 隔离 开 来 ， 允 许 其 使 用 不 同 的 操作 系统 、 数 据 库 、 应 用 服务 器 、 网 络 
浏览 器 以 及 权限 系统 。 采 用 富 于 弹性 的 设计 ，Alfresco 可 以 实现 从 最 简单 的 部 
署 方式 到 最 大 最 复杂 的 部 署 方式 ， 应 用 于 最 小 规模 的 系统 到 最 大 的 集成 
环境 。 

1. 艇 入 式 Alfresco 

能 人 式 Alfresco 直接 安装 在 一 台 主 机 上 ， 主 机 通过 般 入 式 接口 直接 访问 Al- 
fresco， 这 意味 着 主机 与 Alfresco 共享 相同 的 进程 。 典 型 的 主机 需要 以 内 容 为 导向 
的 存储 ， 同 时 包括 内 容 丰 富 的 客户 端 应 用 程序 ， 检 索 和 服务 ， 以 及 管理 着 诸如 测 
试 工 具 和 样 例 。 客 户 端 视 Alfresco 为 第 三 方 类 库 ， 被 能 人 到 Alfresco 网 络 应 用 框 
架 和 应 用 服务 器 中 。 在 任何 时 候 ， 客 户 可 以 挑选 和 组 合 不 同 的 服务 般 入 到 Alfres- 
co ， 人 允许 非常 小 的 Alfresco 版 本 改进 。 主 机 负责 Alfresco 的 开启 和 关闭 。 

2. Alfresco 内 容 应 用 服务 器 

Alfresco 内 容 应 用 服务 器 是 一 个 独立 的 服务 器 ， 它 通过 远程 协议 的 请 求 提 供 
服务 。 一 个 独立 的 服务 器 可 以 支持 任意 数量 的 应 用 和 客户 访问 ， 同 时 新 的 应 用 也 
可 以 任意 增加 。 客 户 端 通过 远程 接口 或 绑 定 协议 访问 Alfresco， 同 时 ，Alfresco 服 
务 器 可 以 通过 配置 关闭 或 忽略 某 些 特定 的 接 人 点 。 这 种 方式 下 Alfresco 被 绑 定 为 
一 个 网 络 应 用 服务 右 ， 而 应 用 服务 器 的 诸多 功能 ， 如 事务 管理 和 资源 池 ， 将 被 注 
入 Alfresco 的 基础 架构 使 Alfresco 可 以 充分 利用 这 些 优 势 。 

3.Alfresco 集群 

Alfresco 采用 集群 的 方式 支持 大 型 系统 ， 多 个 Alfresco 服务 需 协同 工作 ， 路 
多 处 理 器 处 理 用 户 请 求 。Alfresco 网 络 应 用 框架 和 内 容 应 用 服务 需 都 支持 集群 ， 
从 而 可 以 让 不 同 的 层 独立 进行 扩展 。 尽 管 存 储 本 身 可 能 根据 需要 在 不 同 的 节点 上 
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进行 复制 ， 但 在 集群 环境 中 的 Alfresco 内 容 应 用 服务 器 的 每 个 节点 都 可 以 共享 同 
样 的 内 容 仓 库存 储 。 缓 存 和 查询 索引 也 同样 是 分 布 式 的 ， 这 意味 着 集群 内 的 应 用 
服务 器 看 上 去 就 像 一 台 服 务 器 。 特 别 地 ， 一 个 负载 均衡 器 配置 在 集群 的 前 端 来 分 
发 请 求 到 不 同 的 节点 上 。 

这 种 部 署 方式 同样 支持 云 部 署 。 事 实 上 ，Alfresco 提供 的 图 形 工具 可 以 简单 
地 将 集群 内 的 Alfresco 应 用 服务 器 部 署 在 多 个 亚马逊 EC2 虚拟 节点 上 。 

4. 备份 服务 器 

备份 服务 器 是 集群 部 署 的 一 个 特例 ， 当 服务 器 失效 后 ， 一 个 应 用 服务 程序 可 
以 切换 到 备份 版 本 的 部 署 栈 上 去 。 根 据 配 置 ， 备 份 版 本 可 以 立即 应 用 到 失败 的 服 
务 器 上 ( 称 为 热 备份 )， 或 者 短暂 的 停机 后 ,按照 配置 进行 变更 ( 称 为 温 备份 ) 。 
在 集群 内 的 某 一 个 节点 设计 为 主 节 点 ， 支 持 实时 应 用 ， 而 另 一 个 设计 为 从 节点 ， 
持续 从 主 节 点 上 复制 。 从 节点 保持 只 读 状 态 直到 触发 了 切换 点 。 

5. 多 用 户 

多 用 户 模式 允许 单个 Alfresco 应 用 服务 器 (或 者 集群 ) 可 以 同时 支持 多 个 用 
户 ， 用 户 可 以 为 某 个 客户 、 公 司 或 组 织 ， 用 户 像 访问 独立 的 逻辑 分 区 一 样 使 用 
Alfresco， 而 感觉 不 到 其 他 用 户 的 存在 。 而 在 物理 上 ， 所 有 用 户 共享 同样 的 基础 
架构 ， 包 括 集群 内 的 节点 、 内 容 、 仓 库存 储 。 当 然 ， 某 个 用 户 维护 的 数据 不 可 能 
被 其 他 用 户 查看 或 使 用 。 

这 种 类 型 的 部 署 简化 了 管理 并 降低 了 维护 多 种 不 同 的 应 用 与 用 户 基础 相关 的 
成 本 ,尤其 是 在 升级 核心 服务 或 执行 备份 ， 因 为 这 只 需要 为 所 有 住户 做 一 次 
即 可 。 

Alfresco 同时 还 提供 了 管理 多 用 户 的 工具 ， 可 以 实时 创建 新 用 户 。 在 与 集群 
结合 的 同时 ， 多 用 户 模式 提供 了 云 计算 选择 。 


















































10.3 Alfresco 的 应 用 领域 


Alfresco 可 用 来 创建 大 部 分 的 ECM 应 用 。 这 些 应 用 程序 帮助 企业 通过 使 用 内 
容 来 与 客户 、 估 伴 以 及 员工 打交道 。 这 些 应 用 是 富 内 容 的 ， 它 们 的 业务 流程 主要 
集中 在 创建 、 管 理 、 分 发 、 获 取 和 使 用 内 容 上 。 除 了 常用 的 文档 、 影 像 、 记 录 、 
数字 资产 和 Web 内 容 管理 外 ， 还 有 很 多 特殊 的 应 用 能 帮助 企业 增加 价值 并 减少 
费用 和 浪费 。 以 下 是 典型 的 ECM 应 用 ， 并 且 是 Alfresco 特别 擅长 的 构建 的 应 用 
类 型 。 

1. 知识 管理 

知识 管理 是 对 知识 的 获取 以 及 通过 某 种 方式 提供 知识 以 便 其 他 人 使 用 。 内 容 
通常 是 最 好 的 、 也 是 最 容易 被 重用 的 知识 容器 来 与 其 他 人 进行 知识 分 享 。 
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2. 文档 管理 

文档 管理 是 最 具 历 史 的 ECM 应 用 之 一 ， 文 档 管 理 用 来 管理 以 及 共享 Office 
文档 ， 也 用 来 与 业务 流程 集成 ， 进 行文 档 的 创建 、 核 查 、 审 批 和 分 发 。 文 档 管 理 
可 以 是 针对 某 个 产业 或 是 某 个 角色 的 (比如 合同 管理 、 建 议 书 管理 、 说 明 书 管 
理 和 流程 管理 ) ， 同 时 仍旧 可 以 使 用 很 多 通用 的 功能 。 因 此 ， 像 Alfresco Share 和 
Explorer 这 样 的 应 用 是 用 来 创建 文档 管理 应 用 的 很 好 基础 。 

3. 共享 磁盘 替代 

常见 的 基本 的 文档 管理 方式 ， 是 在 企业 内 部 通过 使 用 内 容 库 来 蔡 代 共享 磁 
盘 ， 从 而 提供 更 为 方便 的 内 容 访问 方式 。 共 享 磁盘 很 容易 使 用 ， 但 共享 磁盘 会 导 
致 组 织 的 混乱 ， 当 信息 不 受 控 制 及 无 法 被 发 掘 时 会 引起 管理 方面 的 问题 ， 并 且 根 
本 不 可 能 在 TB 级 的 存储 设备 找到 所 需要 的 信息 。 因 为 Alfresco 支持 共享 磁盘 的 
通信 协议 ， 内 容 库 可 以 被 看 成 是 一 个 共享 磁盘 。 通 过 使 用 规则 、 操 作 和 扩展 ， 可 
以 创建 完整 的 文档 管理 应 用 ， 而 这 些 应 用 在 用 户 获 取 受 控 文 档 和 允许 文档 被 搜索 
时 ， 对 用 户 是 完全 透明 的 。 

4. 企业 门户 和 内 部 网 

企业 门户 是 用 来 与 员工 们 进行 交流 以 及 使 员工 们 及 时 获取 最 新 信息 和 企业 的 
各 方面 发 展 动态 。 有 部 分 企业 门户 集中 于 报表 和 数据 分 析 ， 但 是 大 多 数 企业 门户 
专注 于 内 容 和 文档 方面 。 虽 然 目录 结构 对 于 企业 门户 而 言 是 一 种 简单 的 信息 组 织 
方式 , 但 是 分 类 和 元 数据 通常 是 最 终 用 户 获取 所 需 信息 的 更 好 手段 。 因 此 ,企业 
门户 中 融入 了 文档 管理 和 信息 发 布 的 业务 流程 。 然 而 ， 展示 内 容 的 列表 和 分 类 的 
导航 需要 使 用 Web 脚本 或 Java 编写 portlet 来 实现 。Alfresco 平台 提供 的 一 些 port- 
let 拥有 标准 的 导航 、 搜 索 和 内 容 展现 ， 可 以 很 好 地 协助 上 述 的 开发 。 

5. Web 内 容 管 理 

Web 内 容 管理 是 关于 如 何 管理 Web 网 站 的 ， 包括 管 理 网 站 的 内 容 (如 HT- 
ML 和 图 片 )， 以 及 管理 网 站 从 建立 、 测 试 和 部 署 的 这 样 一 套 流程 。 当 然 ， 
Alfresco 能 被 用 来 建立 简单 的 网 站 。 但 是 ， 它 通常 用 于 创建 Web 应 用 方面 的 网 
站 ， 特 别 是 那些 用 Java 开发 的 Web 应 用 。 一 些 典 型 的 网 站 通常 能 从 多 个 信息 源 
头发 布 信息 ， 并 能 与 电子 商务 和 OA 系统 集成 。 如 果 要 创建 这 类 Web 应 用 和 网 
站 ，Surf 是 一 个 很 好 的 平台 。 

6. 信息 发 布 

信息 发 布 是 一 种 特殊 形式 的 Web 内 容 管理 。 它 涉及 实时 的 从 不 同 信 息 源头 
将 内 容 发 布 至 网 站 和 部 署 该 内 容 至 Web 论坛 便于 互联 网 访问 。 这 能 使 用 数字 资 
产 的 形式 ,例如 文章 〈 可 以 是 内 部 编写 的 或 从 其 他 源头 同步 过 来 的 ) 或 图 片 。 
Alfresco 被 许多 媒体 公司 用 来 绑 定 这 样 的 内 容 并 将 其 发 布 到 他 们 的 网 站 上 。 这 种 
直通 的 信息 发 布 方式 既 需 要 强 有 力 的 内 容 控制 ， 还 需要 高 性 能 来 聚合 内 容 并 推送 
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内 容 ，Alfresco 很 适合 这 种 形式 的 Web 内 容 管 理 。 

7. 记录 管理 

记录 管理 用 来 控制 那些 需要 保存 一 段 时 间 的 重要 信息 。 可 以 在 受 管控 的 或 是 
法 规 遵 从 的 环境 中 ， 基 于 文档 管理 来 使 用 记录 管理 ， 例 如 管理 政府 的 信息 或 是 个 
人 记录 ， 或 是 需要 审计 的 信息 。Alfresco 是 美国 DOD 5015. 2 记录 标准 认证 的 产 
品 ， 对 于 控制 保存 期 和 审核 周期 ， 提 供 特殊 安全 保护 ， 以 及 决定 记录 在 特定 时 间 
段 后 是 否 被 存档 或 是 被 销毁 等 方面 都 很 有 用。 然而 ， 每 个 记录 库 都 是 不 同 的 ， 虽 
然 Alfresco 的 记录 管理 提供 了 一 个 很 好 的 基础 ， 依 旧 可 以 通过 配置 或 定制 化 提供 
其 他 功能 。 无 论 如 何 ， 需 要 配置 专门 针对 某 个 部 门 的 文件 计划 以 部 署 记录 管理 。 

8. 协作 内 容 开 发 

很 多 知识 导向 的 业务 流程 依赖 于 内 容 作 为 信息 容 需 ， 而 这 些 信息 作为 创造 性 
流程 的 一 部 分 被 获取 或 开发 。 协 作 工 作 如 新 产品 开发 、 销 售 建议 书 或 战略 决策 
等 ， 通 常会 生成 文档 或 类 似 的 〈Word 文档 ，PowerPoint 演示 ，Excel 表格 等 ) 文 
件 。 有 些 时 候 内 容 是 协作 的 需要 ， 例 如 ， 创 建 一 份 报表 或 是 编写 一 本 书 ， 
Alfresco 可 用 来 管理 书本 的 编写 。Alfresco 和 Alfresco Share 是 协作 内 容 管 理 方 面 
的 有 用 工具 。Alfresco Share 还 提供 了 一 个 很 好 的 平台 用 来 创建 特殊 的 工具 或 扩 
展 ， 以 帮助 协作 或 处 理 协 作 和 创造 性 过 程 中 的 内 容 。 

9. 案例 管理 

用 来 处 理 与 一 个 案件 相关 的 信息 ， 例 如 保险 索赔 、 调 查 或 个 人 事务 处 理 。 由 
于 Alfresco 的 文档 管理 的 能 力 、 目 录 结 构 、 分 类 配置 和 工作 流 ， 因 此 它 能 很 好 地 
适应 案件 管理 以 及 与 处 理 案 件 相关 的 工作 分 发 。Alfresco 整合 了 JBoss 的 jBPM 工 
作 流 引擎 并 能 处 理 复杂 的 工作 流 和 队列 管理 。Alfresco 拥有 以 内 容 为 导向 的 任务 
模型 ， 该 模型 聚合 了 在 案件 处 理 过 程 中 执行 特定 任务 所 需 的 所 有 资源 。 
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